定义
稀疏主成分分析是一种用于统计分析,特别是多元数据集分析的专门技术。它扩展了传统的主成分分析方法,通过在输入变量中引入稀疏结构来降低数据的维数。
普通PCA的一个特别的缺点是主成分通常是所有输入变量的线性组合。稀疏PCA通过约束来找到只包含几个输入变量的线性组合来克服这个缺点,使得结果更加可解释且鲁棒。换句话说sparse pca就是pca基础上的有一次简化。
图 1 PCA与Sparse PCA的对比
参考文献
[1] https://scikit-learn.org/stable/auto_examples/decomposition/plot_faces_decomposition.html#sphx-glr-download-auto-examples-decomposition-plot-faces-decomposition-py
参阅:约束、稀疏化、主成分分析