sklearn.preprocessing.robust_scale

sklearn.preprocessing.robust_scale(X, *, axis=0, with_centering=True, with_scaling=True, quantile_range=(25.075.0), copy=True)

[源码]

沿任何轴标准化数据集

根据四分位数范围,以中位数和分量明智规模为中心。

用户指南中阅读更多内容。

参数 说明
X array-like
数据要居中和缩放。
axis int (0 by default)
用于计算中位数和IQR的轴。如果为0,则分别缩放每个特征,否则(如果为1)缩放每个样本。
with_centering boolean, True by default
如果为True,则在缩放之前将数据居中。
with_scaling boolean, True by default
如果为True,则将数据缩放到单位方差(或等效地,单位标准偏差)。
quantile_range tuple (q_min, q_max), 0.0 < q_min < q_max < 100.0
默认值:(25.0,75.0)=(第一分位数,第三分位数)= IQR用于计算scale_的分位数范围。
版本0.18中的新功能。
copy boolean, optional, default is True
设置为False可以执行就地行规范化并避免复制(如果输入已经是numpy数组或scipy.sparse CSR矩阵,并且轴为1)。

另见:

RobustScaler

使用Transformer API(例如,作为预处理 sklearn.pipeline.Pipeline的一部分)执行居中和缩放。

注释

此实现将拒绝使scipy.sparse矩阵居中,因为这会使它们变得稀疏,并可能因内存耗尽问题而使程序崩溃。

相反,调用者要么显式设置为_centering=False(在这种情况下,只有对CSR矩阵的特征执行方差缩放),要么调用X.toarray(),如果他/她希望物化密集数组适合内存。

为避免内存复制,调用者应传递一个CSR矩阵。

有关不同缩放器,转换器和规范化器的比较,请参阅examples/preprocessing/plot_all_scaling.py