地址清洗助手

地图帮2026-03-11

地址清洗助手

200 条地址,格式乱七八糟,怎么整理成统一的省/市/区?

你拿到一份客户通讯录 Excel,里面有个"详细地址"列。打开一看:

  • 有的写"北京市朝阳区建国路88号"
  • 有的只写"望京SOHO",省市全没有
  • 有的夹着手机号"广州天河路385号13800138000"
  • 有的全角半角混着来"深圳市南山区科技路100号"

你需要把它们全部拆成"省 / 市 / 区县 / 街道 / 门牌号"五列。手动拆?200 条你可能还忍得住,2000 条呢?

地址清洗助手帮你一键搞定:选好地址列,点一下,系统自动识别省市区、去噪音、补缺失,几秒钟出结果。纯本地处理,不调任何 API,不花钱,不限行数。


你需要准备什么

  • 一份 Excel 或 CSV 文件
  • 至少包含一列中国地址(完整或部分都行,比如只有"朝阳区望京SOHO"也能处理)

跟着走

第一步:打开工具

在左侧菜单点「数据魔方」—— 顶部选「数据处理」Tab —— 点「地址清洗助手」卡片进去。

你会看到一个三步向导页面:步骤1-数据导入 / 步骤2-清洗配置 / 步骤3-清洗结果。


第二步:导入数据

把你的 Excel 或 CSV 文件拖到页面中间的虚线框里,或者点「选择文件」手动选。

没有现成数据?点左下角的「📦 加载示例数据」,系统会生成一份 10 条门店地址的样本,你先拿它试试手感。

导入成功后,下方会出现一个「字段映射」卡片,让你选哪一列是地址列。系统会自动找名字里带"地址""address""addr"的列帮你选好。如果没猜对,手动点下拉框换一个。

到这里,你的屏幕应该是:上方有数据预览表格,下方有"地址列"的下拉选择框已经选好了某一列。


第三步:调清洗选项

点右上角「下一步」,进入清洗配置页。这里有四个开关:

  • 省市区自动补全(默认开)—— 如果地址里只写了"朝阳区"没写省市,系统会帮你补上"北京市"。这个功能靠的是内置行政区划词典,不联网
  • 去除噪音字符(默认开)—— 自动去掉括号里的备注、手机号、固话、邮编、特殊符号
  • 全角转半角(默认开)—— 把"100号"变成"100号",把全角逗号变成半角逗号
  • 尝试纠错(默认关)—— 检测连续重复字,比如"朝阳阳区"改成"朝阳区"。这个功能比较激进,如果你的地址里有合法的重复字(比如人名),建议关着

一般情况下,前三个开着、第四个关着就够了,不用动。

⚠️ 这里很多人会犯一个错:地址列选错了。比如选了"门店名称"列而不是"详细地址"列 —— 跑出来全是"❌ 无法识别区划"。回到第一步,确认下拉框里选的是包含地址文本的那一列


第四步:开始清洗

点「开始清洗」按钮。

页面上方会出现进度条,显示"已处理 50/200 条""已处理 150/200 条"。200 条数据大概 1-2 秒就跑完了,上万条也只要几秒。

跑完后自动跳到第三步结果页,右上角弹出绿色提示"清洗成功"。


第五步:查看结果

结果页会告诉你:

  • 清洗统计 —— 总共多少条、成功率多少、省级/市级/区级识别率分别多少、有多少条是靠词典补全的
  • 结果预览表 —— 你的原始数据后面多了六列:区/县街道地址门牌号清洗状态

清洗状态有三种标记:

  • 完整 —— 省市区全部识别出来了
  • ⚠️ 已补全省市 —— 原始地址缺省或市,系统帮你补上了
  • 无法识别区划 —— 这条地址没法解析,可能是纯英文地址、或者写得太简略

💡 说到这里要特别提醒你:看到 ⚠️ 不代表出错了,反而是系统帮你做了一件好事。比如原始地址只写"望京SOHO",清洗后变成"北京市 / 朝阳区 / 望京SOHO" —— 省市是系统根据"望京"反推补上的,这种情况标记为"已补全省市"。


第六步:导出

对结果满意的话,点结果页的导出按钮,数据会发送到左下角的「数据导出」面板,你可以选格式(Excel / CSV)和保存路径。


做完了,检查一下

如果你在结果预览表里看到"省""市""区/县"三列大部分都填上了内容,成功率在 80% 以上——说明地址清洗已经完成了。

接下来,你可以试试:

  • 把清洗后的数据喂给 地址解析中心,用补全后的标准地址去查经纬度,解析成功率会高很多
  • 想对清洗后的数据做进一步统计?看看 分组聚合统计,按省或按市汇总一下数量
  • 数据量特别大(几万条以上)?放心跑,这个工具纯本地计算,不限行数
最后更新时间 3/21/2026, 1:45:47 PM