回归建模

Logistic 回归 · Lattice 数据分析平台

Logistic 回归用于分析「是」与「否」这类二分类结果。当你需要了解多个变量(如年龄、投入成本或质量指标)如何共同影响最终的转化、成败或患病结果时,可以使用此方法。它能帮你量化各因素对结果的净贡献,并预测事件发生的概率。

理解变量对二分类结果的影响

在学术医学或商业运营中,我们经常面临「是/否」的选择题。logistic 回归通过分析输入变量与二分类结果之间的逻辑关系,帮助你识别哪些因素是影响结果的关键驱动力。它不仅能告诉你变量是否显著,还能定量描述各变量对结果的调节作用。

通过 Lattice,系统会自动计算 95% 置信区间及显著性 p 值,确保你对模型结论的推断既直观又具有统计支撑,免去了手动编写复杂代码的繁琐。

核心输出指标解读

该工具提供完整的分析报告,包括赔率比 (OR)、Wald 置信区间、混淆矩阵以及 AUC 曲线数据。OR 值直接回答了「控制其他变量后,X 变化对结果产生多大影响」的问题,而 AUC 指标则为你评估模型在实际场景下的预测准确性提供了量化参考。

除了系数指标,系统还会自动生成 2×2 混淆矩阵(默认以 0.5 为阈值),帮助你直观检查模型在分类上的准确率、召回率及 F1 分数,从而快速定位模型性能。

适用于真实观测场景

logistic 回归非常适合非实验性的观测数据。无论是医学研究中的病例对照分析 (case-control),还是电商运营中的转化预测,该方法都能在控制其他干扰变量的前提下,清晰地剥离出目标变量的净效应。

为了保证分析质量,当系统发现样本量过小或数据存在完全分离等潜在问题时,会自动发出预警提示,引导你采取更稳健的分析策略,确保结果真实可靠。

1 · Intent → method

An LLM picks regression_logistic from a fixed catalog.

2 · Method → numbers

Deterministic Python engine runs the math. Same input → same output.

3 · Numbers → plain language

A second LLM translates the result into your domain’s vocabulary.

  • Logistic 回归和普通的线性回归有什么区别?

    线性回归适用于连续数值(如收入或温度),而 logistic 回归专门用于二分类结果(如成功或失败)。此方法通过特殊的连接函数将预测值压缩在 0 到 1 之间,使其能够代表事件发生的概率。

  • 为什么输出结果里包含赔率比 (OR)?

    赔率比 (OR) 是 logistic 回归的核心指标,用于量化变量的变化如何改变结果发生的几率。例如,OR=1.05 意味着变量每增加一个单位,事件发生的赔率增加 5%。

  • 怎么判断模型的效果好不好?

    你可以查看输出的 AUC 值和 McFadden pseudo-R²。通常 AUC 越接近 1 模型判别力越强;而 pseudo-R² 则反映了模型对数据的拟合优度,你可以通过这些指标评估分析的可靠性。

Tool 输入字段

Schema for regression_logistic not exported yet (run pnpm export:registry).