R随机森林：集成学习实战

使用randomForest包构建随机森林模型，进行特征重要性评估与预测。 · 难度：入门 · +15XP

随机森林原理

随机森林由多棵决策树集成，通过Bootstrap采样和随机特征子集降低过拟合，具有高准确度和抗噪声能力。可用于分类和回归。

library(randomForest)

data(iris)
set.seed(123)
rf <- randomForest(Species ~ ., data = iris, ntree = 500, importance = TRUE)
print(rf)

importance(rf)
varImpPlot(rf)

pred <- predict(rf, iris)
table(pred, iris$Species)

练习提示：使用mtcars数据集构建随机森林回归模型（预测mpg），并比较与单棵决策树的误差。