sklearn.metrics.completeness_score

sklearn.metrics.completeness_score(labels_true, labels_pred)

源码

给定真实值的聚类标签的完整性度量。

如果属于给定类的所有数据点都是同一群集的元素,则群集结果将满足完整性要求。

此指标独立于标签的绝对值:类别或簇标签值的排列不会以任何方式改变得分值。

此度量标准不是对称的:将label_true与label_pred切换将返回homogeneity_score,该分数通常会有所不同。

用户指南中阅读更多内容。

参数 说明
labels_true int array, shape = [n_samples]
真实类标签用作参考。
labels_pred array-like of shape (n_samples,)
聚类标签以进行评估。
返回值 说明
completeness float
分数介于0.0和1.0之间。 1.0代表完全标签

另见:

homogeneity_score

v_measure_score

参考

1 Andrew Rosenberg and Julia Hirschberg, 2007. V-Measure: A conditional entropy-based external cluster evaluation measure

示例

完全标签是完整的:

>>> from sklearn.metrics.cluster import completeness_score
>>> completeness_score([0011], [1100])
1.0

将所有类成员分配到同一集群的非完全标签仍然是完整的:

>>> print(completeness_score([0011], [0000]))
1.0
>>> print(completeness_score([0123], [0011]))
0.999...

如果类成员分散在不同的群集中,则分配无法完成:

>>> print(completeness_score([0011], [0101]))
0.0
>>> print(completeness_score([0000], [0123]))
0.0