Excel Power Query:数据清洗与合并
学习使用Power Query从多个源导入、清洗和合并数据,提升数据处理效率。 · 难度:入门 · +15XP
Power Query 基础概念
Power Query 是 Excel 中的一项强大数据连接与转换技术。它允许你从各种数据源(如文本文件、数据库、网页)导入数据,并通过直观的界面或 M 语言进行清洗、合并和重塑,而无需修改原始数据。每一次操作都会被记录为一个“步骤”,方便你随时回退或重复执行。
核心操作:从CSV导入并合并
假设你有两个销售文件:Q1_Sales.csv 和 Q2_Sales.csv。使用 Power Query 可以轻松合并它们。
- 点击“数据”选项卡 > “获取数据” > “来自文件” > “从文本/CSV”。
- 选择第一个文件,点击“导入”进入 Power Query 编辑器。
- 在编辑器中,点击“主页” > “合并查询” > “将查询合并为新查询”。
- 选择第二个文件,并匹配公共列(如“订单ID”),选择连接类型(左外部、完全外部等)。
- 点击“确定”,然后展开新列以显示所有字段。
代码示例:使用M语言创建参数
let
源 = Csv.Document(File.Contents("C:\Data\Sales.csv"),[Delimiter=",", Encoding=65001]),
提升的标题 = Table.PromoteHeaders(源, [PromoteAllScalars=true]),
筛选的行 = Table.SelectRows(提升的标题, each [销售额] > 1000)
in
筛选的行练习提示
| 步骤 | 操作说明 |
|---|---|
| 1 | 从当前工作簿的“原始数据”表中导入数据到 Power Query。 |
| 2 | 删除“备注”列,并将“日期”列的类型改为日期格式。 |
| 3 | 按“产品类别”分组,计算每个类别的总销售额。 |
| 4 | 将结果加载回 Excel 工作表“汇总表”。 |
提示:每次点击“关闭并加载”前,检查右侧“查询设置”中的步骤列表是否正确。