sklearn.preprocessing.robust_scale¶
sklearn.preprocessing.robust_scale(X, *, axis=0, with_centering=True, with_scaling=True, quantile_range=(25.0, 75.0), copy=True)
沿任何轴标准化数据集
根据四分位数范围,以中位数和分量明智规模为中心。
在用户指南中阅读更多内容。
参数 | 说明 |
---|---|
X | array-like 数据要居中和缩放。 |
axis | int (0 by default) 用于计算中位数和IQR的轴。如果为0,则分别缩放每个特征,否则(如果为1)缩放每个样本。 |
with_centering | boolean, True by default 如果为True,则在缩放之前将数据居中。 |
with_scaling | boolean, True by default 如果为True,则将数据缩放到单位方差(或等效地,单位标准偏差)。 |
quantile_range | tuple (q_min, q_max), 0.0 < q_min < q_max < 100.0 默认值:(25.0,75.0)=(第一分位数,第三分位数)= IQR用于计算scale_的分位数范围。 版本0.18中的新功能。 |
copy | boolean, optional, default is True 设置为False可以执行就地行规范化并避免复制(如果输入已经是numpy数组或scipy.sparse CSR矩阵,并且轴为1)。 |
另见:
使用Transformer API(例如,作为预处理 sklearn.pipeline.Pipeline
的一部分)执行居中和缩放。
注释
此实现将拒绝使scipy.sparse矩阵居中,因为这会使它们变得稀疏,并可能因内存耗尽问题而使程序崩溃。
相反,调用者要么显式设置为_centering=False(在这种情况下,只有对CSR矩阵的特征执行方差缩放),要么调用X.toarray(),如果他/她希望物化密集数组适合内存。
为避免内存复制,调用者应传递一个CSR矩阵。
有关不同缩放器,转换器和规范化器的比较,请参阅examples/preprocessing/plot_all_scaling.py。