描述性统计助手
地图帮2026-03-10
描述性统计助手
拿到一份数据,第一个问题永远是:这些数字大概什么水平?
你拿到一份数据,第一件事总是想知道:均值多少?波动大不大?有没有极端值?缺失率高不高?
描述性统计助手帮你一键生成每列的完整统计概要 —— 均值、中位数、标准差、偏度、峰度、四分位数、缺失率,全都算好了,一张表看完。
你需要准备什么
- 一份 Excel 或 CSV 文件,至少包含 1 列数值数据
跟着走
第一步:导入数据
打开数据魔方,点击顶部「数据分析」标签页,找到「描述性统计助手」卡片,点进去。
导入你的数据文件。系统会自动识别数值列。
第二步:选择统计列
在参数面板里勾选你要统计的列 —— 可以多选,系统会批量算出每一列的统计值。
还有一个「置信水平」参数,默认 0.95(95%)。不知道这是什么?不用管它,保持默认就好。
第三步:查看结果
点击「开始分析」按钮。结果是一张统计表,每行是一列数据,包含这些指标:
| 指标 | 说明(用人话) |
|---|---|
| 数据量 | 一共多少行 |
| 有效值 | 有多少行不是空的 |
| 缺失值 / 缺失率 | 有多少行是空的,占百分之几 |
| 均值 | 所有数字加起来除以个数 —— 平均水平 |
| 中位数 | 把所有数字从小到大排好,排在正中间的那个。比均值更能反映"正常水平",不会被极端值拉偏 |
| 众数 | 出现次数最多的那个值 |
| 标准差 | 数据波动大不大。标准差越大,说明数据越分散 |
| 方差 | 标准差的平方,意义差不多,只是量纲不同 |
| 最小值 / 最大值 | 极端值 |
| 25% 分位 / 50% 分位 / 75% 分位 | 把数据从小到大排,25% 的位置、50% 的位置(就是中位数)、75% 的位置 |
| 极差 | 最大值减最小值 |
| 变异系数 | 标准差除以均值 —— 用来比较不同量级数据的波动程度。比如"销售额"的标准差 100 万、"订单数"的标准差 50,没法直接比大小,但变异系数可以 |
| 偏度 | 数据是不是偏向一边。偏度 > 0 说明右边有长尾(少数大值拉高了均值),偏度 < 0 说明左边有长尾 |
| 峰度 | 数据是不是特别集中。峰度越大,说明数据越"尖",尾部越厚(极端值越多) |
不用记住这些名词。你只需要关心三个事:
- 缺失率高不高 —— 超过 30% 就要留意
- 均值和中位数差多少 —— 差距大说明有极端值
- 标准差大不大 —— 太大说明数据很分散,分析结果可能不稳定
⚠️ 这里很多人会犯一个错:看到"偏度"和"峰度"不知道是什么,以为分析出了问题。这两个指标是给统计专业人士看的 —— 如果你不确定它们的意义,直接忽略就好,不影响你做判断。
第四步:导出结果
点击「导出」把统计表保存为 Excel,发给同事或者贴进报告里。
做完了,检查一下
如果你看到了一张完整的统计表,每列都有均值、中位数、标准差等指标——说明描述性统计已经完成了。
