sklearn.kernel_approximation.AdditiveChi2Sampler

class sklearn.kernel_approximation.AdditiveChi2Sampler(*, sample_steps=2, sample_interval=None)

[源码]

AdditiveChi2Sampler内核的近似特征图

在一定的区间内对核特征进行Fourier变换采样。

由于要逼近的核是可加的,所以输入向量的分量可以单独处理。原始空间中的每个条目被转换为2*SAMPLE_STEP+1特性,其中SAMPLE_STEP是该方法的一个参数。SAMPLE_STEP的典型值包括1、2和3。

可以计算某些数据范围的抽样间隔的最佳选择(参见参考)。默认值应该是合理的。

阅读更多内容用户指南.

参数 说明
sample_steps int, optional
给出(复)取样点的数目。
sample_interval float, optional
采样间隔,当SAMPLE_STEP不在{1,2,3}中时必须指定。
属性 说明
sample_interval_ float
存储采样间隔如果SAMPLE_STEP不在{1,2,3}中指定为参数。

另见

此估算器近似近加和卡方内核的版本,由metric.additive_chi2计算。

参考文献

1 See “Efficient additive kernels via explicit feature maps” A. Vedaldi and A. Zisserman, Pattern Analysis and Machine Intelligence, 2011

实例

>>> from sklearn.datasets import load_digits
>>> from sklearn.linear_model import SGDClassifier
>>> from sklearn.kernel_approximation import AdditiveChi2Sampler
>>> X, y = load_digits(return_X_y=True)
>>> chi2sampler = AdditiveChi2Sampler(sample_steps=2)
>>> X_transformed = chi2sampler.fit_transform(X, y)
>>> clf = SGDClassifier(max_iter=5, random_state=0, tol=1e-3)
>>> clf.fit(X_transformed, y)
SGDClassifier(max_iter=5, random_state=0)
>>> clf.score(X_transformed, y)
0.9499...
方法 说明
fit(self, X[, y]) 设置参数
fit_transform(self, X[, y]) 适合数据,然后转换它。
get_params(self[, deep]) 获取此估计器的参数。
set_params(self, **params) 设置此估计器的参数。
transform(self, X) 将近似特征映射应用于X。
__init__(self, *, sample_steps=2, sample_interval=None)

[源码]

初始化self, 请参阅help(type(self))以获得准确的说明

fit(self, X, y=None)

[源码]

设置参数

参数 说明
X array-like, shape (n_samples, n_features)
训练数据,其中n个样本中的样本数和n个特征数就是特征数。
返回值 说明
self object
返回 transformer
fit_transform(self, X, y=None,**fit_params)

[源码]

拟合数据,然后对其进行转换。

使用可选参数fit_params将转换器拟合到X和y,并返回X的转换版本。

参数 说明
x {array-like, sparse matrix, dataframe} of shape (n_samples, n_features)
y ndarray of shape (n_samples,), default=None
目标值。
fit_params dict
其他拟合参数。
返回值 说明
X_new ndarray array of shape (n_samples, n_features_new)
变换数组
get_params(self, deep=True)

[源码]

获取此估计量的参数。

参数 说明
deep bool, default=True
如果为True,则将返回此估计器的参数和包含的子对象,这些子对象是估计量。
返回值 说明
params mapping of string to any
映射到其值的参数名称。
set_params(self, **params)

[源码]

该方法适用于简单的估计量以及嵌套对象(例如pipelines)。 后者的参数格式为 __ ,以便可以更新嵌套对象的每个组件。

参数 说明
params dict
估计参数
返回值 说明
self object
估计实例
transform(self, X)

[源码]

将近似特征映射应用于X。

参数 说明
x {array-like, sparse matrix} of shape (n_samples, n_features)
返回值 说明
X_new {array, sparse matrix}, shape = (n_samples, n_features * (2*sample_steps + 1))
返回值是否为稀疏矩阵数组取决于输入X的类型。