Power Query 数据清洗实战
学会使用 Power Query 编辑器快速清洗和转换杂乱数据。 · 难度:入门 · +15XP
Power Query 数据清洗
Power Query 是 Excel 中强大的数据连接与转换工具。它让你无需编写复杂公式,即可从多个源导入数据,并通过可视化界面进行清洗、合并与重塑。
核心概念
- 查询编辑器:所有数据转换操作的图形化界面。
- 步骤记录:每一次操作(如删除列、筛选行)都会生成一个步骤,可随时修改或删除。
- M 语言:Power Query 后台使用的函数式语言,但大部分操作无需手写。
示例:清洗销售数据
假设你有一个包含“产品”、“数量”、“单价”和“日期”的表格,其中“日期”列混有文本和错误值。你需要:
- 从 Excel 表格或 CSV 导入数据。
- 在 Power Query 编辑器中,选择“日期”列,点击“替换值”将错误文本替换为 null。
- 使用“筛选器”移除空行。
- 添加自定义列“金额” = [数量] * [单价]。
- 关闭并加载回 Excel。
| 产品 | 数量 | 单价 | 日期 |
|---|---|---|---|
| A | 10 | 20 | 2024-01-01 |
| B | 错误 | 30 | 2024-01-02 |
练习提示:尝试将上述数据粘贴到 Excel 中,使用“数据”选项卡下的“从表格/区域”创建查询,然后按照步骤清洗。最后将“数量”列中的文本“错误”替换为 0。