sklearn.metrics.mutual_info_score¶
sklearn.metrics.mutual_info_score(labels_true, labels_pred, *, contingency=None)
两个群集之间的互信息。
互信息是对同一数据的两个标签之间相似度的度量。 其中是群集中的样本数,是群集中的样本数,群集U和V之间的互信息为:
此指标独立于标签的绝对值:类别或簇标签值的排列不会以任何方式改变得分值。
此度量标准还对称:将label_true与label_pred切换将返回相同的得分值。当未知真实值时,这对于测量两个独立标签分配策略在同一数据集上的一致性很有用。
在用户指南中阅读更多内容。
参数 | 说明 |
---|---|
labels_true | int array, shape = [n_samples] 数据聚集成不相交的子集。 |
labels_pred | int array-like of shape (n_samples,) 数据聚集成不相交的子集。 |
contingency | {None, array, sparse matrix}, shape = [n_classes_true, n_classes_pred] 由contingency_matrix函数给定的列联矩阵。如果值为None,它将被计算,否则使用给定的值,而labels_true和labels_pred被忽略。 |
返回值 | 说明 |
---|---|
mi | float 互信息,非负值 |
另见:
调整偶然性互信息
标准化互信息
注
使用的对数是自然对数(以e为底)。