在处理事件至发生时间的数据时，若直接剔除未发生事件的样本，会导致统计偏差。生存分析通过纳入删失信息，利用生命表函数有效估计真实生存概率。Lattice 将这一过程模块化：首先由 LLM 识别数据中的时间列与删失编码，确保 event=1 代表事件触发，event=0 代表删失；随后调用高效的确定性引擎执行 Kaplan-Meier 估计或 Cox 风险回归；最后由 LLM 将复杂的置信区间、风险比（HR）及 PH 假设检验结果转化为直观的业务结论或投稿级学术描述。这种架构消除了手动计算删失比例和复杂统计参数的门槛。

何时选择这一家族

数据中存在未完成观察的样本（如研究结束时仍存活的患者或仍未流失的用户）。
需要对比两组或多组间随时间变化的累积发生概率差异。
在排除干扰因素（如年龄、阶段）的前提下，量化单一因素对风险的独立影响。
需评估设备或产品在特定时间点的剩余使用寿命。

生存分析的核心逻辑

生存分析区别于普通回归的关键在于对“删失数据”的处理。它不直接统计平均时长，而是基于每一时点存续个体的比例动态更新发生风险。KM 估计能够生成描述性的生存曲线，而 Cox 回归则允许通过半参数模型调整多个协变量，分析各因素对风险的相对影响（Hazard Ratio）。

在 Lattice 中，我们不仅计算指标，还会自动进行 PH 假设检验。通过检查 Schoenfeld 残差，若模型检测到风险随时间演变的异常波动，系统会提醒你需要通过分层或变换模型来校正结果，确保结论在学术逻辑上严谨可靠。

与其他方法的显著差异

许多新手倾向于直接取平均寿命或使用逻辑回归，但这在处理删失数据时会产生严重偏误。生存分析不假设数据必须在研究结束时完成（即无需等到所有个体都发生事件），这是其区别于普通回归的最本质特征。

相较于描述性的 KM 曲线，Cox 回归提供了更高维度的解释力。它通过拟合协变量系数，能够回答“在控制了其他条件后，该因素对事件发生风险提升了多少”的问题，这是仅通过单变量分析无法获得的深度见解。

常见的统计误区

一个常见的错误是忽视删失编码的准确性。LLM 会在启动分析前显式要求确认哪一列为时间、哪一列为删失标识，因为将事件误判为删失将直接导致生存曲线过高估计。此外，切勿在未达中位生存期时强行计算均值，这种情况应如实报告“随访中位期未达”。

忽略 PH（比例风险）假设是另一大隐患。若 Schoenfeld 检验显示 p 值显著，说明模型假设的“风险比例恒定”不成立，此时直接引用 HR 值会失去统计依据，必须通过分层或调整协变量结构来修正。

常见问题

如果我的数据中完全没有事件发生，可以直接进行生存分析吗？: 不可以。如果 n_events 为 0，Kaplan-Meier 估计将无法计算出任何非平凡的下降，曲线将始终保持为 1，这没有任何统计分析意义。Lattice 会在执行前对此类数据特征进行拦截并给出相应提示。
Cox 回归输出的 'Hazard Ratio' 和 'Coefficient' 应该看哪一个？: 学术投稿通常首选 Hazard Ratio（HR）。它是系数的指数形式，代表了协变量增加一个单位后风险的变化比例。Lattice 会自动计算 HR 的 95% 置信区间，方便你直接用于解释自变量的独立影响。

生存分析

何时选择这一家族

生存分析的核心逻辑

与其他方法的显著差异

常见的统计误区

常见问题

这一家族下的方法

加速失效时间模型 | 全参数生存分析与寿命预测 | Lattice

Cox 比例风险模型 · 生存分析与多因素独立影响评估

Kaplan-Meier 生存曲线：生存分析基础工具 | Lattice

Weibull 生存模型 | 工程可靠性与寿命数据分析 | Lattice