Power Query 数据清洗实战：从行列增删到智能填充与替换

张开发

• 2026/4/20 23:36:32 • 15 分钟阅读

分享文章

1. Power Query数据清洗入门为什么行列操作是第一步刚接触Power Query时我最常犯的错误就是直接对数据动手动脚结果越改越乱。后来才发现数据清洗就像装修房子得先拆墙删除无用行列再粉刷填充替换。拿销售数据来说原始表格往往带着合并单元格、空行、测试数据这些装修废料不清理干净后续分析全完蛋。去年我处理过一份连锁超市的销售报表第一眼看上去就头大前3行是公司Logo第5行开始才是有效数据中间还夹着两行合计值。这时候删除行功能就是救星先用删除最前面几行干掉Logo接着用删除间隔行精准清除合计行最后用删除空行扫尾关键逻辑在于先做减法再做加法。就像下面这个GDP数据处理案例// 删除前两行非数据内容 Table.RemoveRows(Source,0,2) // 提升第三行为标题 Table.PromoteHeaders(#Removed Top Rows)有次我偷懒跳过了删除空行步骤结果做数据透视时系统把空值也计算进去导致月销售额平白多出几十万幽灵数据。血泪教训告诉我们数据清洗阶段省1分钟分析阶段可能要多花1小时纠错。2. 行列操作的进阶技巧比删除更重要的是筛选很多人以为删除行就是简单划掉几行数据其实这里面门道不少。上周帮客户整理会员信息表时就遇到典型场景表格有10万行需要保留2023年的交易记录但年份数据分散在3个不同列里。这时候筛选删除组合拳比单纯删除更高效先用删除最前面几行清理文件说明然后对日期列使用删除空行最后用筛选器保留符合条件的数据// 多条件筛选的M公式示例 Table.SelectRows( #Previous Step, each [OrderDate] #date(2023,1,1) and [OrderDate] #date(2023,12,31) )特别提醒删除重复项功能有个隐藏坑。有次我处理客户订单时直接删重复项结果把同一客户不同日期的订单也合并了。正确做法是先按客户ID和日期降序排列再删除重复项这样才能保留最新记录。这个细节让我的报表准确率直接提升40%。3. 智能填充拯救合并单元格的终极方案财务同事最爱的合并单元格简直是数据分析的噩梦。上个月接手市场部的活动预算表所有部门名称都只合并显示在第一行下面全是null值。这时候向下填充就是救命稻草选中部门列点击转换→填充→向下瞬间所有null值被自动填充 Table.FillDown(#Previous Step,{Department})但更智能的做法是配合填充范围使用。比如处理分地区的销售数据时可以先按大区排序再使用分组填充。最近做零售分析时我用这个技巧处理了200多家门店的库存数据原本需要手动处理2小时的工作3分钟就搞定了。实测发现个冷知识填充功能对日期序列特别敏感。有次填充季度数据时系统自动识别出Q1、Q2的模式连2023-Q4这样的格式都能智能延续。不过遇到不规则数据时建议先排序再填充避免出现错位。4. 替换值的黑科技正则表达式与条件替换普通替换大家都会但Power Query的替换功能其实藏着大招。去年优化物流数据时我发现运单编号里有三种分隔符-, /, _。普通替换要操作三次而用高级替换一次搞定 Table.ReplaceValue( #Previous Step, each [TrackingNumber], each Text.Replace(Text.Replace(Text.Replace(_,-,/),_,/),.,/), Replacer.ReplaceText, {TrackingNumber} )更厉害的是条件替换功能。处理产品价格表时可以用它实现智能替换将库存小于10的显示为需补货把价格高于均值的标记为高单价自动标准化不同分公司的编码格式 Table.ReplaceValue( #Previous Step, each [Inventory], each if [Inventory] 10 then 需补货 else Text.From([Inventory]), Replacer.ReplaceValue, {Inventory} )最近还发现个神技巧替换值对话框里可以用通配符。比如把所有以TMP开头的临时编号批量替换为正式编号这个功能在处理系统导出的临时数据时特别管用。5. 实战案例从混乱数据到标准表格的全流程去年双十一后处理过一份典型的多灾多难数据前5行是活动说明商品分类是合并单元格价格包含¥符号日期有2023/11/11和2023-11-11两种格式完整清洗流程如下删除行阶段删除前5行说明删除测试订单金额为0的记录删除没有用户ID的异常记录填充阶段向下填充商品分类向上填充区域经理姓名替换阶段统一日期分隔符清除价格中的货币符号将缺货替换为0库存// 完整M代码示例 let Source Excel.CurrentWorkbook(){[NameSalesData]}[Content], RemoveTopRows Table.RemoveRows(Source,0,5), RemoveZeroSales Table.SelectRows(RemoveTopRows, each [Amount] 0), FillDownCategory Table.FillDown(RemoveZeroSales,{Category}), CleanPrice Table.ReplaceValue(FillDownCategory,¥,,Replacer.ReplaceText,{Price}), StandardizeDate Table.ReplaceValue(CleanPrice,-,/,Replacer.ReplaceText,{OrderDate}) in StandardizeDate这个案例最值得分享的经验是操作顺序决定效率。如果先做替换再删除行很多替换操作就白做了如果先填充再删除空行可能把需要保留的数据也误删了。经过多次踩坑我现在固定按照删除→填充→替换的流程操作效率至少提升3倍。6. 避坑指南数据清洗中的常见雷区在给20多家企业做过数据清洗后我整理出这些高频踩坑点删除行常见错误忘记先取消合并单元格就直接删除行导致关联数据丢失删除空行时没检查所有关键列造成有效记录被误删删除重复项前未排序保留的不是最新/最大记录填充操作陷阱对已分组的数据使用向下填充打乱原有分组结构填充数值型数据时系统自动转换格式导致精度丢失填充后没有检查边缘情况比如最后几行可能填充错误替换值暗坑替换文本时没勾选完全匹配把包含子串的值也替换了批量替换特殊符号时没考虑转义字符如%需要写成%%替换数字时没处理千分位分隔符导致1,000变成1000有次我替换客户地址中的St.为Street结果把St.Louis也改了整个美国中西部数据全乱套。现在我做重要替换前都会先用预览功能检查影响范围或者新建临时列先做测试替换。

更多文章

前端开发 2026/4/20 23:36:19

d2s-editor技术架构深度解析：基于Web的暗黑2存档逆向工程实现

d2s-editor技术架构深度解析：基于Web的暗黑2存档逆向工程实现【免费下载链接】d2s-editor 项目地址: https://gitcode.com/gh_mirrors/d2/d2s-editor d2s-editor是一款基于现代Web技术栈构建的暗黑破坏神2存档编辑器，采用Vue 3框架实现&#xf…

张开发

前端开发 2026/4/20 23:33:44

如何用 Transferable 对象零拷贝转移超大数组内存给子线程

lang 属性必须写在 <html> 标签上且仅一次，写在 <body> 或其他子元素无效；zh-CN 最常用且兼容性最佳，zh-Hans 强调简体字但不绑定地域，zh 过于宽泛；错误值会导致读屏、翻译、CSS 和 SEO 失效。lang 属性该…

张开发

前端开发 2026/4/20 23:33:32

【收藏】2026年金三银四大厂AI招聘指南｜大模型扩招爆发，百万年薪可冲（小白/程序员必看）

到了2026年三四月，职场圈里的程序员们都在热议一句话：金三银四正式来袭！ 每年这个时候，都是职场求职的黄金窗口期——大厂春招补录全面开启，暑期实习提前批同步抢人，既是应届生抓住最后一波集中上岸的关键机…

张开发

前端开发 2026/4/20 23:33:25

从仿射到透视：一次EIS算法核心运动模型的升级实践

1. 从旋转平移模型到仿射透视模型的认知转变刚开始接触电子稳像(EIS)算法时，我和大多数开发者一样，都是从最基础的旋转平移模型(rigid motion)入手的。这种模型假设图像中的所有运动都可以用简单的旋转和平移来描述，实现起来确实简单直接。在…

张开发

前端开发 2026/4/20 23:29:25

PCB焊接翻车实录：SOT、SOD、MELF这些奇葩封装，我是怎么一个个搞定的

PCB焊接翻车实录：SOT、SOD、MELF这些奇葩封装，我是怎么一个个搞定的记得第一次拿到那块布满微型封装的PCB时，我的手指不自觉地抖了一下。SOT-963的尺寸比芝麻还小，MELF电阻圆滚滚的像微型胶囊，SOD-523二极管薄得几乎透…

张开发

前端开发 2026/4/20 23:15:13

Python 中的全局变量 global 和 globals()

本文介绍了Python中global关键字和globals()函数的区别与用法。global用于在函数内部声明要修改的全局变量，而globals()返回包含所有全局变量的字典，可用于动态访问和修改全局变量。文章通过示例展示了二者的基本用法、嵌套函数中的应用、动态操作全局变…

张开发

前端开发 2026/4/20 23:12:06

题解：AcWing 885 求组合数I

本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法…

张开发

前端开发 2026/4/20 23:12:05

题解：AcWing 889 满足条件的01序列

张开发

前端开发 2026/4/20 23:00:18

如何通过magic.css模块化导入实现动画类按需加载，显著减少项目体积

如何通过magic.css模块化导入实现动画类按需加载，显著减少项目体积【免费下载链接】magic CSS3 Animations with special effects 项目地址: https://gitcode.com/gh_mirrors/ma/magic magic.css是一款强大的CSS3动画库，提供了丰富的特殊效果动画…

张开发

前端开发 2026/4/20 22:58:20

iOS设备个性化定制与功能扩展完整指南：5个步骤解锁iPhone隐藏潜力

iOS设备个性化定制与功能扩展完整指南：5个步骤解锁iPhone隐藏潜力【免费下载链接】Jailbreak iOS 26.4 - 26, 17 - 17.7.5 & iOS 18 - 18.7.3 Jailbreak Tools, Cydia/Sileo/Zebra Tweaks & Jailbreak News Updates || AI Jailbreak Finder 👇 …

张开发

前端开发 2026/4/20 22:56:21

kubectl-debug性能优化：如何配置资源限制和启动参数

kubectl-debug性能优化：如何配置资源限制和启动参数【免费下载链接】kubectl-debug This repository is no longer maintained, please checkout https://github.com/JamesTGrant/kubectl-debug. 项目地址: https://gitcode.com/gh_mirrors/ku/kubectl-debug …

张开发

前端开发 2026/4/20 22:52:24

youlai-mall会员服务开发指南：用户管理与积分系统实现

youlai-mall会员服务开发指南：用户管理与积分系统实现【免费下载链接】youlai-mall 🚀基于 Spring Boot 3、Spring Cloud & Alibaba 2022、SAS OAuth2 、Vue3、Element-Plus、uni-app 构建的开源全栈商城。项目地址: https://gitcode.com/gh_mir…

张开发

Power Query 数据清洗实战：从行列增删到智能填充与替换

最新文章

深度解决显卡配置难题：NVIDIA Profile Inspector专业故障排除与优化指南

WooCommerce 多联盟站点动态追加 Affiliate ID 教程

旷世之作，云南第一书画史诗《白族创世纪》诞生，中国艺术的经典

永磁同步电机的磁链矢量控制怎么实现？

如何在 CSS 中实现元素的绝对定位，使其不受窗口尺寸变化影响

终极免费神器：3分钟搞定Elsevier审稿状态追踪的完整指南

推荐文章

支付回调幂等与对账怎么设计？一次讲清重复通知、状态校验、补单与差异修复

企业内网部署EVA-02：安全策略与内网穿透方案

【HALCON 25.11 + C#】 03：HImage、HRegion、HXLD、HTuple——C#中HALCON数据类型实战详解（避坑指南+工业案例）

3种创新方法让Windows电脑直接安装安卓APK文件

Linux 设备树DTS语法精讲：从节点到属性的实战解析

如何高效实施开源医疗信息系统：完整医院数字化转型方案

相关文章

探索Akagi：实时牌局分析与AI决策支持的麻将辅助系统

SEO 视频在不同行业的应用有何差异_SEO 视频的长度应该控制在什么范围内

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台植物病虫害识别系统

生成式引擎优化（GEO）实战指南：从技术架构到行业落地

嵌入式开发调试宏与性能优化实战

LosslessCut：解锁无损视频编辑的5个专业技巧

分享文章

更多文章

d2s-editor技术架构深度解析：基于Web的暗黑2存档逆向工程实现

如何用 Transferable 对象零拷贝转移超大数组内存给子线程

【收藏】2026年金三银四大厂AI招聘指南｜大模型扩招爆发，百万年薪可冲（小白/程序员必看）

从仿射到透视：一次EIS算法核心运动模型的升级实践

PCB焊接翻车实录：SOT、SOD、MELF这些奇葩封装，我是怎么一个个搞定的

Python 中的全局变量 global 和 globals()

题解：AcWing 885 求组合数I

题解：AcWing 889 满足条件的01序列

如何通过magic.css模块化导入实现动画类按需加载，显著减少项目体积

iOS设备个性化定制与功能扩展完整指南：5个步骤解锁iPhone隐藏潜力

kubectl-debug性能优化：如何配置资源限制和启动参数

youlai-mall会员服务开发指南：用户管理与积分系统实现

Power Query 数据清洗实战：从行列增删到智能填充与替换

最新文章

深度解决显卡配置难题：NVIDIA Profile Inspector专业故障排除与优化指南

WooCommerce 多联盟站点动态追加 Affiliate ID 教程

旷世之作，云南第一书画史诗《白族创世纪》诞生，中国艺术的经典

永磁同步电机的磁链矢量控制怎么实现？

如何在 CSS 中实现元素的绝对定位，使其不受窗口尺寸变化影响

终极免费神器：3分钟搞定Elsevier审稿状态追踪的完整指南

推荐文章

支付回调幂等与对账怎么设计？一次讲清重复通知、状态校验、补单与差异修复

企业内网部署EVA-02：安全策略与内网穿透方案

【HALCON 25.11 + C#】 03：HImage、HRegion、HXLD、HTuple——C#中HALCON数据类型实战详解（避坑指南+工业案例）

3种创新方法让Windows电脑直接安装安卓APK文件

Linux 设备树DTS语法精讲：从节点到属性的实战解析

如何高效实施开源医疗信息系统：完整医院数字化转型方案

相关文章

探索Akagi：实时牌局分析与AI决策支持的麻将辅助系统

SEO 视频在不同行业的应用有何差异_SEO 视频的长度应该控制在什么范围内

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台 植物病虫害识别系统

生成式引擎优化（GEO）实战指南：从技术架构到行业落地

嵌入式开发调试宏与性能优化实战

LosslessCut：解锁无损视频编辑的5个专业技巧

分享文章

更多文章

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台植物病虫害识别系统