sklearn.metrics.matthews_corrcoef

sklearn.metrics.matthews_corrcoef(y_true, y_pred, *, sample_weight=None)

源码

计算马修斯相关系数(MCC)

Matthews相关系数在机器学习中用作衡量二进制和多类分类质量的指标。它考虑了真假正例和负例,通常被认为是平衡的度量,即使类别的大小差异很大,也可以使用该度量。MCC本质上是介于-1和+1之间的相关系数值。系数+1代表理想预测,0代表平均随机预测,-1代表逆预测。该统计也称为phi系数。[来源:维基百科]

支持二进制和多类标签。 仅在二进制情况下,才与真假正例和负例有关。 请参阅下面的参考。

用户指南中阅读更多内容。

参数 说明
y_true array, shape = [n_samples]
真实目标值。
y_pred array, shape = [n_samples]
分类器返回的估计目标。
sample_weight array-like of shape (n_samples,), default=None
样本权重。
版本0.18中的新功能。
返回值 说明
mcc float
马修斯相关系数(+1代表理想预测,0代表平均随机预测,-1代表反向预测)。

参考

1 Baldi, Brunak, Chauvin, Andersen and Nielsen, (2000). Assessing the accuracy of prediction algorithms for classification: an overview

2 Wikipedia entry for the Matthews Correlation Coefficient

3 Gorodkin, (2004). Comparing two K-category assignments by a K-category correlation coefficient

4 Jurman, Riccadonna, Furlanello, (2012). A Comparison of MCC and CEN Error Measures in MultiClass Prediction

示例

>>> from sklearn.metrics import matthews_corrcoef
>>> y_true = [+1, +1, +1-1]
>>> y_pred = [+1-1, +1, +1]
>>> matthews_corrcoef(y_true, y_pred)
-0.33...