sklearn.cluster.estimate_bandwidth

sklearn.cluster.estimate_bandwidth(X, *, quantile=0.3, n_samples=None, random_state=0, n_jobs=None)

[源码]

用Mean-Shift算法估计带宽。

这个函数在所花费的时间至少是n_samples的二次方的。对于大型数据集,明智的做法是将该参数设置为一个小值。

参数 说明
X array-like of shape (n_samples, n_features)
输入点
quantile float, default=0.3
应介于[0,1]之间, 0.5意味着使用所有成对距离的中位数。
n_samples int, default=None
要使用的样本数。如果没有提供,则使用所有样本。
random_state int, RandomState instance, default=None
用于从输入点随机选择样本的生成器用于带宽估计。使用整数使随机性确定性。见Glossary
n_jobs int, default=None
要为邻居搜索的并行作业数。None意味1, 除非在joblib.parallel_backend环境中。-1指使用所有处理器。有关详细信息,请参Glossary
返回值 说明
bandwidth float
带宽参数