sklearn.metrics.balanced_accuracy_score

sklearn.metrics.balanced_accuracy_score(y_true, y_pred, *, sample_weight=None, adjusted=False)

[源码]

计算平衡精度

二元和多类分类问题中的平衡精度可以处理不平衡的数据集。 它定义为每个类获得的召回率的平均值。

adjusted=False时,最佳值为1,最差值为0。

用户指南中阅读更多内容。

0.20版中的新功能。

参数 说明
y_true 1d array-like
真实的目标值。
y_pred 1d array-like
分类器返回的估计目标。
sample_weight array-like of shape (n_samples,), default=None
样本权重。
adjusted bool, default=False
如果为true,将根据偶然性对结果进行调整,以便随机性能得分为0,而完美性能得分为1。
返回值 说明
balanced_accuracy float

另见

recall_score, roc_auc_score

一些文献提出了平衡精度的替代定义。我们的定义等效于具有类平衡的样本权重的accuracy_score,并与二进制情况共享理想的属性。 请参阅用户指南

参考

Brodersen, K.H.; Ong, C.S.; Stephan, K.E.; Buhmann, J.M. (2010). The balanced accuracy and its posterior distribution. Proceedings of the 20th International Conference on Pattern Recognition, 3121-24.

2

John. D. Kelleher, Brian Mac Namee, Aoife D’Arcy, (2015). Fundamentals of Machine Learning for Predictive Data Analytics: Algorithms, Worked Examples, and Case Studies.

示例

>>> from sklearn.metrics import balanced_accuracy_score
>>> y_true = [010010]
>>> y_pred = [010001]
>>> balanced_accuracy_score(y_true, y_pred)
0.625