sklearn.metrics.mutual_info_score

sklearn.metrics.mutual_info_score(labels_true, labels_pred, *, contingency=None)

源码

两个群集之间的互信息。

互信息是对同一数据的两个标签之间相似度的度量。 其中是群集中的样本数,是群集中的样本数,群集U和V之间的互信息为:

此指标独立于标签的绝对值:类别或簇标签值的排列不会以任何方式改变得分值。

此度量标准还对称:将label_true与label_pred切换将返回相同的得分值。当未知真实值时,这对于测量两个独立标签分配策略在同一数据集上的一致性很有用。

用户指南中阅读更多内容。

参数 说明
labels_true int array, shape = [n_samples]
数据聚集成不相交的子集。
labels_pred int array-like of shape (n_samples,)
数据聚集成不相交的子集。
contingency {None, array, sparse matrix}, shape = [n_classes_true, n_classes_pred]
由contingency_matrix函数给定的列联矩阵。如果值为None,它将被计算,否则使用给定的值,而labels_true和labels_pred被忽略。
返回值 说明
mi float
互信息,非负值

另见:

adjusted_mutual_info_score

调整偶然性互信息

normalized_mutual_info_score

标准化互信息

使用的对数是自然对数(以e为底)。

sklearn.metrics.mutual_info_score应用示例