sklearn.metrics.homogeneity_completeness_v_measure

sklearn.metrics.homogeneity_completeness_v_measure(labels_true, labels_pred, *, beta=1.0)

源码

一次计算同质性和完整性以及V-Measure分数。

这些度量基于聚类标签的归一化条件熵度量,在考虑同一样本的真实标签的情况下进行评估。

如果所有聚类仅包含属于单个类的成员的数据点,则聚类结果满足同质性。

如果属于给定类的所有数据点都是同一群集的元素,则群集结果将满足完整性要求。

两个分数的正值在0.0到1.0之间,较大的值是可取的。

这3个指标与标签的绝对值无关:类别或簇标签值的排列不会以任何方式改变得分值。

V-Measure也是对称的:交换labels_true和label_pred将得到相同的分数。这不适用于同质性和完整性。使用算术平均方法,V度量与normalized_mutual_info_score 相同。

用户指南中阅读更多内容。

参数 说明
labels_true int array, shape = [n_samples]
真实类标签用作参考
labels_pred array-like of shape (n_samples,)
聚类标签以进行评估
beta float
归因于均质性(homogeneity)与完整性(completeness)的比重比。如果beta大于1,则在计算中对完整性的加权更大。如果beta小于1,则同质性的权重会更大。
返回值 说明
homogeneity float
分数介于0.0和1.0之间。1.0代表完全的均质标签
completeness float
分数介于0.0和1.0之间。 1.0代表完全标签
v_measure float
前两个的调和平均数

另见:

homogeneity_score

completeness_score

v_measure_score