sklearn.decomposition.sparse_encode

sklearn.decomposition.sparse_encode(X, dictionary, *, gram=None, cov=None, algorithm='lasso_lars', n_nonzero_coefs=None, alpha=None, copy_cov=True, init=None, max_iter=1000, n_jobs=None, check_input=True, verbose=0, positive=False)[source]

[源码]

稀疏编码

结果的每一行都是稀疏编码问题的解决方案。目标是找到一个稀疏数组代码,这样:

X ~= code * dictionary

用户指南中阅读更多内容.

参数 说明
X array of shape (n_samples, n_features)
数据矩阵
dictionary array of shape (n_components, n_features)
用于求解数据稀疏编码的字典矩阵。有些算法假设有意义的输出是标准化的行。
gram array, shape=(n_components, n_components)
预先计算的克矩阵,字典*字典'
cov array, shape=(n_components, n_samples)
预计算协方差,字典' * X
algorithm {‘lasso_lars’, ‘lasso_cd’, ‘lars’, ‘omp’, ‘threshold’}
ars:使用最小角度回归法(linear_model.lars_path) lasso_lars:使用lars计算Lasso解lasso_cd:使用坐标下降法计算Lasso解(linear_model.Lasso)如果估计的组件是稀疏的,lasso_lars会更快。omp:使用正交匹配追踪估计稀疏解阈值:将投影字典中所有小于alpha的系数都压缩为零* X '
n_nonzero_coefs int, 0.1 * n_features by default
在解的每一列中目标的非零系数的数目。这只被算法='lars'和算法='omp'使用,在omp情况下被alpha覆盖。
alpha float, 1. by default
如果算法='lasso_lars'或算法='lasso_cd',则alpha是对L1范数的惩罚。如果算法='threshold', alpha是阈值的绝对值,低于这个阈值,系数将被压缩为零。若算法='omp',则alpha为容差参数:目标重构误差的值。在本例中,它覆盖n_nonzero_coefs。
copy_cov boolean, optional
是否复制预计算的协方差矩阵;如果为False,则可能被覆盖。
init array of shape (n_samples, n_components)
稀疏编码的初始化值。仅当算法='lasso_cd'时使用。
max_iter int, 1000 by default
如果算法='lasso_cd'或lasso_lars,则执行的最大迭代次数。
n_jobs int or None, optional (default=None)
要运行的并行作业数量。没有一个是1,除非在joblib。parallel_backend上下文。-1表示使用所有处理器。参见术语表了解更多细节。
check_input boolean, optional
如果为假,则不会检查输入数组X和dictionary。
verbose int, optional
控制冗长;越高,信息越多。默认值为0。
positive boolean, optional
在寻找编码时是否要加强积极性。

新版本0.20。
返回值 说明
code array of shape (n_samples, n_components)
稀疏编码

另见: