sklearn.metrics.homogeneity_completeness_v_measure¶
sklearn.metrics.homogeneity_completeness_v_measure(labels_true, labels_pred, *, beta=1.0)
一次计算同质性和完整性以及V-Measure分数。
这些度量基于聚类标签的归一化条件熵度量,在考虑同一样本的真实标签的情况下进行评估。
如果所有聚类仅包含属于单个类的成员的数据点,则聚类结果满足同质性。
如果属于给定类的所有数据点都是同一群集的元素,则群集结果将满足完整性要求。
两个分数的正值在0.0到1.0之间,较大的值是可取的。
这3个指标与标签的绝对值无关:类别或簇标签值的排列不会以任何方式改变得分值。
V-Measure也是对称的:交换labels_true和label_pred将得到相同的分数。这不适用于同质性和完整性。使用算术平均方法,V度量与normalized_mutual_info_score
相同。
在用户指南中阅读更多内容。
参数 | 说明 |
---|---|
labels_true | int array, shape = [n_samples] 真实类标签用作参考 |
labels_pred | array-like of shape (n_samples,) 聚类标签以进行评估 |
beta | float 归因于均质性(homogeneity)与完整性(completeness)的比重比。如果beta大于1,则在计算中对完整性的加权更大。如果beta小于1,则同质性的权重会更大。 |
返回值 | 说明 |
---|---|
homogeneity | float 分数介于0.0和1.0之间。1.0代表完全的均质标签 |
completeness | float 分数介于0.0和1.0之间。 1.0代表完全标签 |
v_measure | float 前两个的调和平均数 |
另见: