Toggle Menu

sklearn.preprocessing.MinMaxScaler¶

class sklearn.preprocessing.MinMaxScaler(feature_range=(0, 1), *, copy=True)

通过将每个要素缩放到给定范围来变换要素。

该估计器分别缩放和转换每个特征，以使其在训练集上处于给定范围内，例如介于零和一之间。

转换方式为：

X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))
X_scaled = X_std * (max - min) + min

最小，最大= feature_range。

此变换通常用作零均值，单位方差缩放的替代方法。

阅读更多内容参见用户指南。

参数	说明
feature_range	tuple (min, max), default=(0, 1) 所需的转换数据范围。
copy	bool, default=True 设置为False可以执行就地行规范化并避免复制（如果输入已经是numpy数组）。

属性	说明
min_	ndarray of shape (n_features,) 每个功能调整的最小值。等效于min-X.min（axis = 0）* self.scale_
scale_	ndarray of shape (n_features,) 每个要素的数据相对缩放。相当于(max - min) / (X.max(axis=0) - X.min(axis=0)) 0.17版中的新功能：scale_属性。
data_min_	ndarray of shape (n_features,) 数据中显示的每个功能最小值 0.17版中的新功能：data_min_
data_range_	ndarray of shape (n_features,) 数据中看到的每个要素范围（data_max_-data_min_） 0.17版中的新功能：data_range_
n_samples_seen_	int 估计器处理的样本数。它将在新的调用中重置为fit，但会在partial_fit调用中递增。

另见：

没有估算器API的等效函数。

注释

NaN被视为缺失值：忽略适合度，并保持变换值。

有关不同缩放器，转换器和规范化器的比较，请参阅examples/preprocessing/plot_all_scaling.py。

示例

>>> from sklearn.preprocessing import MinMaxScaler
>>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
>>> scaler = MinMaxScaler()
>>> print(scaler.fit(data))
MinMaxScaler()
>>> print(scaler.data_max_)
[ 1. 18.]
>>> print(scaler.transform(data))
[[0.   0.  ]
 [0.25 0.25]
 [0.5  0.5 ]
 [1.   1.  ]]
>>> print(scaler.transform([[2, 2]]))
[[1.5 0. ]]

方法

方法	说明
`fit`(X[, y])	计算用于以后缩放的最小值和最大值。
`fit_transform`(X[, y])	拟合数据，然后对其进行转换。
`get_params`([deep])	获取此估计量的参数。
`inverse_transform`(X)	根据feature_range撤消X的缩放比例。
`partial_fit`(X[, y])	在线计算X上的最小值和最大值，以便以后缩放。
`set_params`(**params)	设置此估算器的参数。
`transform`(X)	根据feature_range缩放X的要素。

__init__(feature_range=(0, 1), *, copy=True)

初始化self,有关准确的签名，请参见help（type（self））。

fit(X, y=None)

计算用于以后缩放的最小值和最大值。

参数	说明
X	array-like of shape (n_samples, n_features) 该数据用于计算每个特征的最小值和最大值，以用于以后沿特征轴缩放。
y	None 忽略。

返回值	说明
self	object 合适的定标器。

fit_transform(X, y=None, **fit_params)

拟合数据，然后对其进行转换。

使用可选参数fit_params将转换器拟合到X和y，并返回X的转换版本。

参数	说明
X	{array-like, sparse matrix, dataframe} of shape (n_samples, n_features)
y	ndarray of shape (n_samples,), default=None 目标值。
**fit_params	dict 其他拟合参数。

返回值	说明
X_new	ndarray array of shape (n_samples, n_features_new) 转换后的数组。

get_params(deep=True)

获取此估计量的参数。

参数	说明
deep	bool, default=True 如果为True，则将返回此估算器和作为估算器的所包含子对象的参数。

返回值	说明
params	mapping of string to any 参数名称映射到其值。

inverse_transform(X)

根据feature_range撤消X的缩放比例。

参数	说明
X	array-like of shape (n_samples, n_features) 输入将要转换的数据。不能稀疏。

返回值	说明
Xt	array-like of shape (n_samples, n_features) 转换后的数据。

partial_fit(X, y=None)

在线计算X上的最小值和最大值，以便以后缩放。

所有X都作为一个批处理。这适用于由于n_sample数量过多或从连续流中读取X而无法进行拟合的情况。

参数	说明
X	array-like of shape (n_samples, n_features) 该数据用于计算每个特征的最小值和最大值，以用于以后沿特征轴缩放。
y	None 忽略。

返回值	说明
self	object 合适的定标器。

set_params(**params)

设置此估算器的参数。

该方法适用于简单的估计器以及嵌套对象（例如管道）。后者的参数形式为<component>__<parameter>这样就可以更新嵌套对象的每个组件。

参数	说明
**params	dict 估算器参数。

返回值	说明
self	object 合适的定标器。

transform(X)

根据feature_range缩放X的要素。

参数	说明
X	array-like of shape (n_samples, n_features) 输入将要转换的数据。不能稀疏。

返回值	说明
Xt	array-like of shape (n_samples, n_features) 转换后的数据。

sklearn.preprocessing.MinMaxScaler使用示例¶

比较MLPClassifier的随机学习策略

比较MLPClassifier的随机学习策略 ¶

单变量特征选择

单变量特征选择 ¶

将不同缩放器对数据的影响与离群值进行比较

将不同缩放器对数据的影响与离群值进行比较 ¶

加入交流群
备注:机器学习