因果推断

工具变量法 | 2SLS 因果推断与稳健性检验 | Lattice

当数据中的处理变量与不可观测的因素相关时,普通回归会产生偏差。工具变量法通过寻找与处理相关、但与干扰项无关的“工具”,帮助你剥离内生影响,识别真实的因果效应。Lattice 会自动验证工具的有效性,防止无效工具带来的推断陷阱。

理解工具变量法的核心逻辑

工具变量法通过“两阶段最小二乘法”来实现。在第一阶段,模型提取处理变量中受工具变量影响的部分;在第二阶段,再利用这部分“净化”后的变动来解释结果变量。这种方法的核心优势在于它能有效地隔离干扰因素,从而提供更接近真实的因果系数。

在 Lattice 平台上,该方法自动处理回归计算,并报告所有系数的统计显著性,同时配套提供标准误差的稳健估计,确保推断结果更加严谨。

防御性分析:反幻觉检查

因果推断最忌讳盲目信任系数。Lattice 内置了针对工具变量法的双重反幻觉检查:弱工具变量检测(以 F 值是否小于 10 为界)和过度识别检验(Sargan J 检验)。

如果检测到弱工具风险或过度识别违规,系统会直接标记相关的风险旗标。此时,平台将建议你慎做因果解读,并提示你检查工具变量的合法性或考虑其他模型设定。

如何解读计算结果

工具变量法输出的 LATE(局部平均处理效应)是衡量干预效果的核心指标。除了输出具体的估计值与置信区间外,Lattice 还提供第一阶段的诊断信息,帮助你评估工具变量的强度与外生性假设是否得到支持。

我们建议用户在引用结果时,始终结合领域知识论证“排除限制”假设,即论证工具变量为何不直接影响结果变量,这在因果分析中至关重要。

1 · Intent → method

An LLM picks causal_iv from a fixed catalog.

2 · Method → numbers

Deterministic Python engine runs the math. Same input → same output.

3 · Numbers → plain language

A second LLM translates the result into your domain’s vocabulary.

  • 为什么 Lattice 要自动做 First-stage F 检验?

    如果工具变量与处理变量之间的相关性过弱,2SLS 估计量的偏差会急剧增大。工具变量法内置的 F 检验能及时识别这种“弱工具”风险,避免你基于不可靠的统计结果做因果解读。

  • 什么是 Sargan J 检验?

    当你拥有的工具变量数量多于内生变量数量时,Sargan J 检验会评估这些工具变量是否与干扰项外生。如果检验拒绝了原假设,说明至少有一个工具变量可能通过非预期渠道影响了结果,此时应重新审视模型设定。

Tool 输入字段

Schema for causal_iv not exported yet (run pnpm export:registry).