1.8. 交叉分解

交叉分解模块主要包含两个算法族: 偏最小二乘法(PLS)和典型相关分析(CCA)。

这些算法族具有发现两个多元数据集之间的线性关系的用途: fit method (拟合方法)的参数 XY 都是 2 维数组。

http://sklearn.apachecn.org/cn/0.19.0/_images/sphx_glr_plot_compare_cross_decomposition_0011.png

交叉分解算法能够找到两个矩阵 (X 和 Y) 的基础关系。它们是对在两个空间的协方差结构进行建模的隐变量方法。它们将尝试在X空间中找到多维方向,该方向能够解释Y空间中最大多维方差方向。 PLS回归特别适用于当预测变量矩阵具有比观测值更多的变量以及当X值存在多重共线性时。相比之下,在这些情况下,标准回归将失败。

包含在此模块中的类有:PLSRegression, PLSCanonical, CCA, PLSSVD

参考资料

示例:

下一章:1.9. 朴素贝叶斯

朴素贝叶斯方法是基于贝叶斯定理的一组有监督学习算法,即“简单”地假设每对特征之间相互独立。 给定一个类别 和一个从 到 的相关的特征向量, 贝叶斯定理阐述了以下关系:使用简单(naive) ...