R降维PCA主成分分析
学习主成分分析(PCA)原理,使用prcomp进行降维,并通过碎石图与双标图解释结果。 · 难度:入门 · +15XP
PCA降维原理
主成分分析通过正交变换将原始变量转换为少数几个不相关的主成分,保留最大方差。常用于高维数据可视化与特征压缩。
1. 数据准备与标准化
PCA要求数据标准化(均值为0,标准差为1),因为变量尺度差异会影响方差。
data(iris)
iris_num <- iris[, 1:4]
iris_scaled <- scale(iris_num)2. 执行PCA
pca_result <- prcomp(iris_scaled, center = TRUE, scale. = TRUE)
summary(pca_result)3. 解释结果
summary()显示每个主成分的方差贡献率。前两个主成分通常能解释大部分方差。
| 主成分 | 标准差 | 方差贡献率 | 累积贡献率 |
|---|---|---|---|
| PC1 | 1.708 | 0.729 | 0.729 |
| PC2 | 0.956 | 0.229 | 0.958 |
4. 可视化
使用factoextra包绘制碎石图与双标图。
library(factoextra)
fviz_eig(pca_result, addlabels = TRUE)
fviz_pca_biplot(pca_result, col.ind = iris$Species)练习提示
在下方代码中,尝试使用iris数据集,将前两个主成分的得分保存为新数据框,并用ggplot2绘制散点图着色Species。