空间共位分析 · 原理与参数详解

次数	速度	精度	适用场景
99	快	P 值精度到 0.01	试探性分析，先看看大致结果
199	中等	P 值精度到 0.005	比较正式的分析
499	较慢	P 值精度到 0.002	标准的学术分析
999	慢	P 值精度到 0.001	发表论文级别

第一次跑先用 99，确认参数没问题后再调高。最终出结果建议用 499 或 999。

⚠️ 置换次数和数据量共同决定计算时间。100 个点 × 99 次置换通常几秒搞定；1000 个点 × 999 次可能需要几分钟。

最小参与率阈值（仅模式挖掘）

只在「共位模式挖掘」模式下用到。

参与指数低于这个阈值的模式会被过滤掉。比如你设了 0.5，那只有至少 50% 的相关点都参与了共位的模式才会保留。

0.5：标准值，适合大多数场景
0.3：宽松一些，会发现更多模式（包括一些较弱的关联）
0.7：严格，只保留非常强的关联

💡 如果跑出来 0 个模式，别慌 —— 降低阈值到 0.2~0.3 再试。数据量小的时候，真正强共位的模式可能就是少。

距离步数和最大距离（仅 Cross-K）

只在「Cross-K 多尺度分析」模式下用到。

距离步数：把从 0 到最大距离的范围分成多少段来计算。步数越多曲线越平滑，但计算越慢。10~20 步通常够用
最大距离：分析到多远。系统默认取数据范围的 1/4，一般不用改

第四部分：结果字段详解

局部 LCLQ 结果表

分析完成后，你的数据表会多出这些列：

列名	含义	怎么看
LCLQ	局部共位商	> 1 = 附近 B 多，< 1 = 附近 B 少，= 1 = 随机
PVALUE	P 值	< 0.05 通常认为显著。越小越确定
LCLQBIN	显著性分类编号	0=显著共位，1=共位不显著，2=显著孤立，3=孤立不显著
LCLQTYPE	显著性分类标签	上面编号的中文说明
CLQ_A_B	全局共位商	所有 A 类点的 LCLQ 均值（每行都一样）
NEIGHCATS_cnt	邻居中 B 的加权比例	用于核查计算过程，一般不用看

四种显著性分类是什么意思

地图上的四种颜色，对应结果表中 LCLQBIN 的四种取值：

0 —— 显著共位（Colocated & Significant）🔴

LCLQ > 1 且 P < 0.05。这个点附近 B 类确实比随机预期多，而且通过了统计检验。这是你最关心的结果 —— 它标记的就是"共位真正发生的地方"。

1 —— 共位但不显著（Colocated & Not Significant）🟠

LCLQ > 1 但 P ≥ 0.05。看起来附近 B 多，但统计上不够确定 —— 可能只是碰巧。

2 —— 显著孤立（Isolated & Significant）🔵

LCLQ < 1 且 P < 0.05。这个点附近 B 类确实比预期少，而且统计确认了。说明这个位置对 B 类有某种"排斥"效应。

3 —— 孤立但不显著（Isolated & Not Significant）⚪

LCLQ < 1 但 P ≥ 0.05。附近 B 类偏少，但不确定是不是偶然。

💡 一般来说，你主要关注类型 0（红色）和类型 2（蓝色）。它们是经过统计检验的可靠结论。橙色和灰色可以作为参考，但不要据此做重要决策。

P 值到底怎么理解

P 值可能是整个分析里最容易误解的东西。这里用大白话讲一次：

P 值 = 在"A 和 B 没有关系"的假设下，你观测到的结果（或更极端的结果）出现的概率。

换句话说：

P = 0.03 —— 如果 A 和 B 真的没关系，那你看到的这种结果只有 3% 的概率出现。3% 太小了，所以你有理由怀疑"没关系"这个假设是错的 → 结论：可能真的有关系
P = 0.20 —— 如果没关系，这种结果有 20% 的概率出现。20% 不算小，可能就是碰巧 → 结论：证据不够

0.05 这条线是谁定的？

这是学术界的惯例，不是自然规律。0.05 只是一个"大家普遍能接受的门槛"。有些领域用 0.01（更严格），有些用 0.10（更宽松）。在实际业务中，你可以根据决策的严重程度灵活掌握：

做学术研究 → 严格按 0.05
做商业选址参考 → 0.10 也可以接受
做高风险决策（比如医疗） → 最好用 0.01

⚠️ P 值不是"A 和 B 有关系的概率"。这是一个非常常见的误解。P=0.03 不是说"有 97% 的概率有关系"。统计学没有这么简单，但在实际使用中，你可以大致理解为"证据越强，P 值越小"。

第五部分：常见疑问

"我的数据不是经纬度，是高德坐标 / 百度坐标，能用吗？"

能用，但建议先做坐标转换。

地图帮的共位分析在计算距离时，会把经纬度转换成笛卡尔坐标（三维直角坐标系），然后用欧氏距离做近邻搜索。这种方法在小范围内（一个城市或一个省）精度完全够用，但前提是你的坐标是标准的 WGS84 经纬度。

高德坐标（GCJ02）和百度坐标（BD09）都做了偏移加密，直接用会导致距离计算有几十到几百米的误差。对于 K=5~10、距离带 1000 米以上的分析，这个误差通常影响不大。但如果你追求严谨，建议先用地图帮的坐标系转换工具转成 WGS84。

"数据量有什么限制？"

理论上没有硬性上限，但：

50 条以下：置换检验不稳定，P 值参考价值低
100~500 条：比较理想的范围，结果可靠，速度也快
500~2000 条：没问题，置换次数建议先用 99
2000 条以上：可以跑，但置换检验会比较慢。建议先用低置换次数测试参数，确认没问题再调高

"全局 CLQ 和平均 LCLQ 什么关系？"

全局 CLQ 就是所有 A 类点的 LCLQ 均值。所以：

全局 CLQ > 1 → 整体来看 A 附近 B 偏多
全局 CLQ ≈ 1 → 整体上没有特殊关联
全局 CLQ < 1 → 整体来看 A 附近 B 偏少

但全局 CLQ 可能掩盖空间异质性 —— 也许城北的便利店旁边奶茶店特别多，城南特别少，平均下来正好约等于 1。所以全局 CLQ 只是概览，真正有价值的是看局部 LCLQ 的空间分布。

"模式挖掘的参与指数和 LCLQ 有什么区别？"

两个指标衡量的东西不一样：

LCLQ：对每个具体的点，衡量"这个点附近 B 类是否偏多"
参与指数：对一个类别组合，衡量"这两类（或多类）是否普遍地出现在彼此附近"

参与指数是一个全局汇总指标，不区分具体哪个点。LCLQ 是逐点计算的局部指标。

一般的使用路径是：先用模式挖掘发现值得关注的类别对，再切换到 LCLQ 模式深入分析具体哪些区域的共位最强。

"Cross-K 的峰值距离和 K 值 / 距离带怎么配合？"

一个很好的实践方法：

先跑 Cross-K，找到峰值距离（比如 800 米）
然后用「距离带」邻域 + 800 米半径跑局部 LCLQ
这样你的 LCLQ 分析就精确锁定在了"共位最强的空间尺度"上

这比凭感觉设 K 值要科学得多。

"结果全是不显著，是不是软件出了问题？"

大概率不是。全不显著说明你的两类要素之间确实不存在显著的空间关联 —— 这本身也是一个有价值的结论。

但在下结论之前，先排查几个常见原因：

数据量太小 —— 低于 50 条时，置换检验的统计功效很低，即使有真实的共位也可能检测不出来
K 值不合适 —— K 太大会把远处不相关的点拉进来，稀释真实的局部共位信号
类别太细 —— 如果每种类别只有几个点，统计检验很难达到显著水平
本来就没有关系 —— 这完全正常。"没有显著关联"也是一种发现

第六部分：学术背景

如果你要在论文或报告里引用这个方法，以下是核心参考文献：

LCLQ 方法：Wang, F., Hu, Y., Wang, S. & Li, X. (2017). "Local Indicator of Colocation Quotient with a Statistical Significance Test." The Professional Geographer, 69(1), 22-31.
全局 CLQ：Leslie, T.F. & Kronenfeld, B.J. (2011). "The Colocation Quotient: A New Measure of Spatial Association Between Categorical Subsets of Points." Geographical Analysis, 43(3), 306-326.
Joinless 模式挖掘：Yoo, J.S. & Shekhar, S. (2006). "A Joinless Approach for Mining Spatial Colocation Patterns." IEEE TKDE, 18(10), 1323-1337.
Cross-K 函数：Ripley, B.D. (1977). "Modelling Spatial Patterns." Journal of the Royal Statistical Society B, 39(2), 172-212.

在报告中描述分析方法时，可以这样写：

空间共位分析采用局部协同区位商方法（LCLQ, Wang et al. 2017），以 K=8 的 KNN 邻域和高斯核函数计算局部共位商，并通过 999 次置换检验在 α=0.05 水平判断显著性。

做完了，检查一下

如果你把这篇详解从头读到这里——恭喜，你现在对空间共位分析的理解已经不输于大多数 GIS 从业者了。

回到快速上手版再跑一次分析，你会发现每个参数、每个结果字段都变得有意义了。

看到 LCLQ=1.49 你知道它意味着"比随机多了 49%"；看到 P=0.03 你知道这个结论有多可靠；看到 Cross-K 曲线的峰值你知道该用什么距离去做进一步分析。

数据分析的价值不在于跑出一堆数字，而在于你知道每个数字在说什么。

空间共位分析 · 原理与参数详解

内容目录