sklearn.utils.Class_weight.compute_class_weight¶

sklearn.utils.class_weight.compute_class_weight(class_weight, *, classes, y)

估计不平衡数据集的类权重。

参数	说明
class_weight	dict, ‘balanced’ or None 如果为“平衡”，则类权重将通过n_samples /（n_classes * np.bincount（y））给出权重。如果传入字典，则键为类，值为相应的类权重。如果未指定，则类权重将是一致的。
classes	ndarray 数据中出现的类的数组，由np.unique（y_org）和y_org的原始类标签给出。
y	array-like, shape (n_samples,) 每个样本的原始类标签数组。

返回值	说明
class_weight_vect	ndarray, shape (n_classes,) 第i个类的权重

参考资料

“平衡的”启发式方法是根据《稀有事件数据》中的逻辑回归得出的，King，Zen，2001。