sklearn.preprocessing.Normalizer¶
class sklearn.preprocessing.Normalizer(norm='l2', *, copy=True)
将样本分别归一化为单位范数。
具有至少一个非零分量的每个样本(即数据矩阵的每一行)都独立于其他样本进行重新缩放,以使其范数(l1,l2或inf)等于1。
该转换器可以使用密集的numpy数组和scipy.sparse矩阵(如果要避免复制/转换的负担,请使用CSR格式)。
例如,将输入缩放到单位范数是文本分类或聚类的常见操作。例如,两个十二个标准化TF-IDF向量的点积是向量的余弦相似度,并且是信息检索社区通常使用的向量空间模型的基本相似度。
阅读更多内容参见用户指南。
参数 | 说明 |
---|---|
norm | 用于规范化每个非零样本的范数。 如果使用norm ='max',则将按绝对值的最大值重新缩放值。 |
copy | boolean, optional, default True 设置为False可以执行就地行规范化并避免复制(如果输入已经是numpy数组或scipy.sparse CSR矩阵)。 |
另见:
没有估算器API的等效函数。
示例
该估计器是无状态的(除了构造函数参数之外),fit方法什么也不做,但是在管道中使用时很有用。
有关不同缩放器,转换器和归一化器的比较,请参见examples/preprocessing/plot_all_scaling.py。
示例
>>> from sklearn.preprocessing import Normalizer
>>> X = [[4, 1, 2, 2],
... [1, 3, 9, 3],
... [5, 7, 5, 1]]
>>> transformer = Normalizer().fit(X) # fit does nothing.
>>> transformer
Normalizer()
>>> transformer.transform(X)
array([[0.8, 0.2, 0.4, 0.4],
[0.1, 0.3, 0.9, 0.3],
[0.5, 0.7, 0.5, 0.1]])
方法
方法 | 说明 |
---|---|
fit (X[, y]) |
不执行任何操作,并使估算器保持不变 |
fit_transform (X[, y]) |
拟合数据,然后对其进行转换。 |
get_params ([deep]) |
获取此估计量的参数。 |
set_params (**params) |
设置此估算器的参数。 |
transform (X[, copy]) |
将X的每个非零行缩放为单位范数 |
__init__(norm='l2', *, copy=True)
始化self,有关准确的签名,请参见help(type(self))。
fit(X, y=None)
不执行任何操作,并使估算器保持不变
该方法仅用于实现常规API,因此可以在管道中使用。
参数 | 说明 |
---|---|
X | array-like |
fit_transform(X, y=None, **fit_params)
拟合数据,然后对其进行转换。
使用可选参数fit_params将转换器拟合到X和y,并返回X的转换版本。
参数 | 说明 |
---|---|
X | {array-like, sparse matrix, dataframe} of shape (n_samples, n_features) |
y | ndarray of shape (n_samples,), default=None 目标值。 |
**fit_params | dict 其他拟合参数。 |
返回值 | 说明 |
---|---|
X_new | ndarray array of shape (n_samples, n_features_new) 转换后的数组。 |
get_params(deep=True)
获取此估计量的参数。
参数 | 说明 |
---|---|
deep | bool, default=True 如果为True,则将返回此估算器和作为估算器的所包含子对象的参数。 |
返回值 | 说明 |
---|---|
params | mapping of string to any 参数名称映射到其值。 |
set_params(**params)
设置此估算器的参数。
该方法适用于简单的估计器以及嵌套对象(例如管道)。后者的参数形<component>__<parameter>这样就可以更新嵌套对象的每个组件。
参数 | 说明 |
---|---|
**params | dict 估算器参数。 |
返回值 | 说明 |
---|---|
self | object 估算器实例。 |
transform(X, copy=None)
将X的每个非零行缩放为单位范数
参数 | 说明 |
---|---|
X | {array-like, sparse matrix}, shape [n_samples, n_features] 要逐行标准化的数据。scipy.sparse矩阵应采用CSR格式,以避免不必要的复制。 |
返回值 | 说明 |
---|---|
copy | bool, optional (default: None) 是否复制输入X。 |