🏷️ 标签:Excel | Power Query | 数据清洗 | ETL | 数据分析 | Excel技巧
前言:你还在手动清洗数据吗?
数据分析师圈子里有个经典笑话:
“80%的时间在清洗数据,20%的时间在抱怨为什么要清洗数据。”
这话说得扎心,但很真实。
想象这样一个场景:
每周一,你都要从ERP系统导出一份上周销售数据,然后:
- 删除空白行
- 把"2024-01-01"格式统一成"20240101"
- 把"销售额"列的数字格式修复(因为导出时它莫名其妙变成了文本)
- 把A列和B列合并成一个字段
- 删除C列里那些乱码
- 把处理好的数据复制到汇总表里
每周重复一次,每次20分钟。一年下来,8小时就这么没了。
今天这篇文章,我要介绍的工具——Power Query——能把这20分钟变成一键自动,5秒钟搞定。
而且——你改需求了?加个字段?换个数据源?点点鼠标就能改,公式不用动一根汗毛。
一、Power Query 是什么?先破除三个误解
误解一:“Power Query就是个高级筛选工具”
错。Power Query的核心是ETL:
E(Extract) → 提取:从各种数据源拉取数据 T(Transform)→ 转换:清洗、改造、重构数据 L(Load) → 加载:把处理好的数据放到目标位置这跟"筛选"完全不是一个量级的东西。
误解二:“Power Query太复杂,Excel基础用户用不上”
Power Query最大的特点,恰恰就是不需要写代码。
所有操作都是"点击 + 点点鼠标",每一步操作都被自动记录成"查询步骤"——你可以随时回溯、修改、删除任何一步。
比Excel函数还直观,因为你能看到每一步在做什么。
误解三:“Power Query加载很慢,不如手动快”
那是因为你没体会到**“下次更快”**的价值。
Power Query的查询一旦建立,下次数据更新时,你只需要"刷新",所有步骤自动重跑。
- 手动处理:每周20分钟 × 52周 = 17小时/年
- Power Query:第1次建查询30分钟,之后每次刷新5秒钟
用得越久,省得越多。
二、Power Query 界面:认识三个核心区域
2.1 启动 Power Query
方法一:数据 → 获取数据 → 选择数据源
方法二:数据 → 从表/区域(把当前Excel数据加载到Power Query)
方法三:直接 Alt + N + P(新版本快捷键)
2.2 Power Query 编辑器的三大区域
┌──────────────────────────────────────────────────────┐ │ 功能区(操作按钮都在这里) │ │ [主页] [转换] [添加列] [查看] │ ├──────────────────────────────────────────────────────┤ │ 查询列表(左边栏)│ 数据预览(中间主区域) │ │ 查询1 │ ┌────┬────┬────┐ │ │ 查询2 │ │列A │列B │列C │ │ │ 查询3 │ ├────┼────┼────┤ │ │ │ │数据│数据│数据│ │ │ │ └────┴────┴────┘ │ ├──────────────────────────────────────────────────────┤ │ 查询设置(右边栏) │ │ 应用的步骤: │ │ ① 源(数据来源) │ │ ② 更改的类型 │ │ ③ 删除的空行 │ │ ④ 合并列