1.8 交叉分解

交叉分解模块包含两大类算法:偏最小二乘法(PLS)和典型相关分析(CCA)。

这几类算法对于寻找两个多元数据集之间的线性关系是很有用的:fit方法的XY参数是二维数组。

交叉分解算法能够找到两个矩阵 (X 和 Y) 的基础关系。它们是对在两个空间的协方差结构进行建模的隐变量方法。它们将尝试在X空间中找到多维方向,该方向能够解释Y空间中最大多维方差方向。 PLS回归特别适用于当预测变量矩阵具有比观测值更多的变量以及当X值存在多重共线性的情况。相比之下,在这些情况下,标准回归将失败。

本模块中包含的类有PLSRegression PLSCanonical, CCAPLSSVD

参考

JA Wegelin A survey of Partial Least Squares (PLS) methods, with emphasis on the two-block case

示例
交叉分解法比较