Logistic 回归用于分析「是」与「否」这类二分类结果。当你需要了解多个变量(如年龄、投入成本或质量指标)如何共同影响最终的转化、成败或患病结果时,可以使用此方法。它能帮你量化各因素对结果的净贡献,并预测事件发生的概率。
理解变量对二分类结果的影响
在学术医学或商业运营中,我们经常面临「是/否」的选择题。logistic 回归通过分析输入变量与二分类结果之间的逻辑关系,帮助你识别哪些因素是影响结果的关键驱动力。它不仅能告诉你变量是否显著,还能定量描述各变量对结果的调节作用。
通过 Lattice,系统会自动计算 95% 置信区间及显著性 p 值,确保你对模型结论的推断既直观又具有统计支撑,免去了手动编写复杂代码的繁琐。
核心输出指标解读
该工具提供完整的分析报告,包括赔率比 (OR)、Wald 置信区间、混淆矩阵以及 AUC 曲线数据。OR 值直接回答了「控制其他变量后,X 变化对结果产生多大影响」的问题,而 AUC 指标则为你评估模型在实际场景下的预测准确性提供了量化参考。
除了系数指标,系统还会自动生成 2×2 混淆矩阵(默认以 0.5 为阈值),帮助你直观检查模型在分类上的准确率、召回率及 F1 分数,从而快速定位模型性能。
适用于真实观测场景
logistic 回归非常适合非实验性的观测数据。无论是医学研究中的病例对照分析 (case-control),还是电商运营中的转化预测,该方法都能在控制其他干扰变量的前提下,清晰地剥离出目标变量的净效应。
为了保证分析质量,当系统发现样本量过小或数据存在完全分离等潜在问题时,会自动发出预警提示,引导你采取更稳健的分析策略,确保结果真实可靠。
1 · Intent → method
An LLM picks regression_logistic from a fixed catalog.
2 · Method → numbers
Deterministic Python engine runs the math. Same input → same output.
3 · Numbers → plain language
A second LLM translates the result into your domain’s vocabulary.
Logistic 回归和普通的线性回归有什么区别?
线性回归适用于连续数值(如收入或温度),而 logistic 回归专门用于二分类结果(如成功或失败)。此方法通过特殊的连接函数将预测值压缩在 0 到 1 之间,使其能够代表事件发生的概率。
为什么输出结果里包含赔率比 (OR)?
赔率比 (OR) 是 logistic 回归的核心指标,用于量化变量的变化如何改变结果发生的几率。例如,OR=1.05 意味着变量每增加一个单位,事件发生的赔率增加 5%。
怎么判断模型的效果好不好?
你可以查看输出的 AUC 值和 McFadden pseudo-R²。通常 AUC 越接近 1 模型判别力越强;而 pseudo-R² 则反映了模型对数据的拟合优度,你可以通过这些指标评估分析的可靠性。
Tool 输入字段
Schema for regression_logistic not exported yet (run pnpm export:registry).