sklearn.utils.Class_weight.compute_class_weight

sklearn.utils.class_weight.compute_class_weight(class_weight, *, classes, y)

源码

估计不平衡数据集的类权重。

参数 说明
class_weight dict, ‘balanced’ or None
如果为“平衡”,则类权重将通过n_samples /(n_classes * np.bincount(y))给出权重。 如果传入字典,则键为类,值为相应的类权重。 如果未指定,则类权重将是一致的。
classes ndarray
数据中出现的类的数组,由np.unique(y_org)和y_org的原始类标签给出。
y array-like, shape (n_samples,)
每个样本的原始类标签数组。
返回值 说明
class_weight_vect ndarray, shape (n_classes,)
第i个类的权重

参考资料

“平衡的”启发式方法是根据《稀有事件数据》中的逻辑回归得出的,King,Zen,2001。