sklearn.feature_selection.VarianceThreshold¶
class sklearn.feature_selection.VarianceThreshold(threshold=0.0)
删除所有低方差特征的特征选择器。
此特征选择算法仅查看特征(X),而不查看所需的输出(y),因此可用于无监督学习。
在用户指南中阅读更多内容。
参数 | 说明 |
---|---|
threshold | float, optional 训练集方差低于此阈值的特征将被删除。默认设置是保留所有具有非零方差的特征,即删除所有样本中具有相同值的特征。 |
属性 | 说明 |
---|---|
variances_ | array, shape (n_features,) |
注
在输入中允许使用NaN。
示例
下面的数据集具有整数特征,每个样本中有两个特征是相同的。这些是使用阈值的默认设置删除的:
>>> X = [[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3]]
>>> selector = VarianceThreshold()
>>> selector.fit_transform(X)
array([[2, 0],
[1, 4],
[1, 1]])
方法
方法 | 说明 |
---|---|
fit (X[, y]) |
从X中学习经验方差。 |
fit_transform (X[, y]) |
拟合数据,然后对其进行转换。 |
get_params ([deep]) |
获取此估计器的参数。 |
get_support ([indices]) |
获取所选特征的掩码或整数索引。 |
inverse_transform (X) |
反向转换操作 |
set_params (**params) |
设置此估计器的参数。 |
transform (X) |
将X缩小为选定的特征。 |
__init__(threshold=0.0)
初始化self,参见help(type(self))获取更多信息。
fit(X, y=None)
从X中学习经验方差。
参数 | 说明 |
---|---|
X | {array-like, sparse matrix}, shape (n_samples, n_features) 用于计算方差的样本向量。 |
y | any 忽略。存在此参数是为了与sklearn.pipeline.Pipeline兼容。 |
返回值 | 说明 |
---|---|
self |
fit_transform(X, y=None, **fit_params)
拟合数据,然后对其进行转换。
使用可选参数fit_params将转换器拟合到X和y,并返回X的转换值。
参数 | 说明 |
---|---|
X | {array-like, sparse matrix, dataframe} of shape (n_samples, n_features) |
y | ndarray of shape (n_samples,), default=None 目标值 |
**fit_params | dict 其他拟合参数。 |
返回值 | 说明 |
---|---|
X_new | ndarray array of shape (n_samples, n_features_new) 转换后的数组。 |
get_params(deep=True)
获取此估计器的参数。
参数 | 说明 |
---|---|
deep | bool, default=True 如果为True,则将返回此估算器和所包含子对象的参数。 |
返回值 | 说明 |
---|---|
params | mapping of string to any 参数名称映射到其值。 |
get_support(indices=False)
获取所选特征的掩码或整数索引。
参数 | 说明 |
---|---|
indices | boolean (default False) 如果为True,则返回值将是一个整数数组,而不是布尔掩码。 |
返回值 | 说明 |
---|---|
support | array 从特征向量中选择保留特征的索引。如果 indices 为False,则为形状为[#输入特征]的布尔数组,其中元素为True时(如果已选择其对应的特征进行保留)。如果indices 为True,则这是一个形状为[#输出特征]的整数数组,其值是输入特征向量的索引。 |
inverse_transform(X)
反向转换操作。
参数 | 说明 |
---|---|
X | array of shape [n_samples, n_selected_features] 输入样本。 |
返回值 | 说明 |
---|---|
X_r | array of shape [n_samples, n_original_features]X 中插入的列名为零的特征将被transform 删除。 |
set_params(**params)
设置此估算器的参数。
该方法适用于简单的估计器以及嵌套对象(例如管道)。后者具有<component>__<parameter>
形式的参数, 以便可以更新嵌套对象的每个组件。
参数 | 说明 |
---|---|
**params | dict 估计器参数。 |
返回值 | 说明 |
---|---|
self | object 估计器实例。 |
transform(X)
将X缩小为选定的特征。
参数 | 说明 |
---|---|
X | array of shape [n_samples, n_features] 输入样本。 |
返回值 | 说明 |
---|---|
X_r | array of shape [n_samples, n_selected_features] 仅具有所选特征的输入样本。 |