sklearn.metrics.completeness_score¶
sklearn.metrics.completeness_score(labels_true, labels_pred)
给定真实值的聚类标签的完整性度量。
如果属于给定类的所有数据点都是同一群集的元素,则群集结果将满足完整性要求。
此指标独立于标签的绝对值:类别或簇标签值的排列不会以任何方式改变得分值。
此度量标准不是对称的:将label_true与label_pred切换将返回homogeneity_score
,该分数通常会有所不同。
在用户指南中阅读更多内容。
参数 | 说明 |
---|---|
labels_true | int array, shape = [n_samples] 真实类标签用作参考。 |
labels_pred | array-like of shape (n_samples,) 聚类标签以进行评估。 |
返回值 | 说明 |
---|---|
completeness | float 分数介于0.0和1.0之间。 1.0代表完全标签 |
另见:
参考
示例
完全标签是完整的:
>>> from sklearn.metrics.cluster import completeness_score
>>> completeness_score([0, 0, 1, 1], [1, 1, 0, 0])
1.0
将所有类成员分配到同一集群的非完全标签仍然是完整的:
>>> print(completeness_score([0, 0, 1, 1], [0, 0, 0, 0]))
1.0
>>> print(completeness_score([0, 1, 2, 3], [0, 0, 1, 1]))
0.999...
如果类成员分散在不同的群集中,则分配无法完成:
>>> print(completeness_score([0, 0, 1, 1], [0, 1, 0, 1]))
0.0
>>> print(completeness_score([0, 0, 0, 0], [0, 1, 2, 3]))
0.0