R降维PCA主成分分析
掌握prcomp函数进行PCA降维,理解方差解释率与双标图可视化 · 难度:入门 · +15XP
主成分分析:化繁为简
PCA(主成分分析)是无监督降维的经典方法,通过正交变换将原始变量转换为少数几个主成分,保留最大方差信息。
1. 数据标准化
PCA对尺度敏感,通常先标准化。
data(iris)
iris_scaled <- scale(iris[,1:4])
head(iris_scaled)2. 运行PCA
pca_result <- prcomp(iris_scaled, center = FALSE, scale. = FALSE)
summary(pca_result)3. 方差解释率
查看每个主成分解释的方差比例。
var_explained <- pca_result$sdev^2 / sum(pca_result$sdev^2)
var_explained
# 前两个主成分累计解释95%以上4. 双标图可视化
library(ggplot2)
biplot(pca_result, scale=0)PCA关键输出:
| 对象 | 含义 |
|---|---|
| rotation | 载荷矩阵(变量与主成分的关系) |
| x | 主成分得分(降维后的数据) |
| sdev | 各主成分标准差 |
练习提示:使用USArrests数据集做PCA,绘制双标图并解释前两个主成分。