多个指标降维成少数几个主成分,彼此之间互不相关;

研究的问题涉及到多变量且变量之间存在很强的相关性,可用主成分分析

用于聚类(指标存在强关联性)和回归分析,不能用于评价类模型

可以解决多重共线性的问题(同时逐步回归也可以)

思想

Untitled

Untitled

计算步骤

  1. 构成样本矩阵
  2. 标准化处理样本矩阵,计算协方差矩阵(相关系数矩阵)
  3. 计算协方差矩阵的特征值和特征向量
  4. 计算主成分贡献率和累计贡献率
  5. 写出主成分
  6. 根据系数分析主成分代表的意义
  7. 利用主成分结果进行后续分析

MATLAB代码