sklearn.cluster.estimate_bandwidth¶
sklearn.cluster.estimate_bandwidth(X, *, quantile=0.3, n_samples=None, random_state=0, n_jobs=None)
用Mean-Shift算法估计带宽。
这个函数在所花费的时间至少是n_samples的二次方的。对于大型数据集,明智的做法是将该参数设置为一个小值。
参数 | 说明 |
---|---|
X | array-like of shape (n_samples, n_features) 输入点 |
quantile | float, default=0.3 应介于[0,1]之间, 0.5意味着使用所有成对距离的中位数。 |
n_samples | int, default=None 要使用的样本数。如果没有提供,则使用所有样本。 |
random_state | int, RandomState instance, default=None 用于从输入点随机选择样本的生成器用于带宽估计。使用整数使随机性确定性。见Glossary。 |
n_jobs | int, default=None 要为邻居搜索的并行作业数。 None 意味1, 除非在joblib.parallel_backend 环境中。-1 指使用所有处理器。有关详细信息,请参Glossary。 |
返回值 | 说明 |
---|---|
bandwidth | float 带宽参数 |