sklearn.utils.Class_weight.compute_class_weight¶
sklearn.utils.class_weight.compute_class_weight(class_weight, *, classes, y)
估计不平衡数据集的类权重。
参数 | 说明 |
---|---|
class_weight | dict, ‘balanced’ or None 如果为“平衡”,则类权重将通过n_samples /(n_classes * np.bincount(y))给出权重。 如果传入字典,则键为类,值为相应的类权重。 如果未指定,则类权重将是一致的。 |
classes | ndarray 数据中出现的类的数组,由np.unique(y_org)和y_org的原始类标签给出。 |
y | array-like, shape (n_samples,) 每个样本的原始类标签数组。 |
返回值 | 说明 |
---|---|
class_weight_vect | ndarray, shape (n_classes,) 第i个类的权重 |
参考资料
“平衡的”启发式方法是根据《稀有事件数据》中的逻辑回归得出的,King,Zen,2001。