残差图是检查回归模型是否可靠的直观工具。当你完成了线性回归分析,想要确认模型是否遗漏了关键信息,或者数据是否存在偏差时,可以使用残差图来观察预测值与实际值之间的差异分布,从而直观地判断模型对数据的解释程度。
理解模型误差
残差指的是实际观测值与模型预测值之间的差额。在回归分析中,残差不仅仅是“错误”,它更像是模型留下的“指纹”。通过残差图,您可以直观地看到模型未能解释的部分。
在 Lattice 中,我们支持两种核心的诊断视角:一种是残差与拟合值的散点图,用于寻找模型结构上的漏洞;另一种是残差的分布直方图,用于检查误差的随机特性。
诊断异方差与非线性
通过将残差与拟合值进行对比,您可以观察数据点是否随机分布在零线附近。如果散点呈现出漏斗状或喇叭状的扩撒趋势,这通常意味着模型存在异方差问题,即模型在不同取值范围下的预测精度不一致。
如果残差呈现出明显的形状,说明模型对规律的提取不彻底。这种可视化手段能让您迅速判断是否存在需要修复的结构性偏差,而无需深陷复杂的统计假设测试。
验证残差分布特征
除了模式检查,残差的分布情况同样重要。残差直方图为您提供了一个快速查看残差正态性的窗口。如果残差分布呈现出明显的长尾或严重的倾斜,您可能需要重新审视输入数据或考虑使用更适合的模型形态。
我们通过 Freedman-Diaconis 规则自动优化直方图的箱数(bins),确保您看到的图形在视觉上更加客观,减少了因人为设置参数导致的主观偏差。
1 · Intent → method
An LLM picks plot_residual from a fixed catalog.
2 · Method → numbers
Deterministic Python engine runs the math. Same input → same output.
3 · Numbers → plain language
A second LLM translates the result into your domain’s vocabulary.
为什么我的残差图里会出现明显的曲线?
当残差图呈现出曲线模式而非均匀分布时,通常说明你的回归模型未能完全捕捉变量间的线性关系,即存在非线性特征,你可能需要考虑在模型中加入多项式项或转换变量。
残差直方图的作用是什么?
残差直方图用于查看误差的分布情况。理想情况下,残差应围绕零点呈对称的正态分布。如果直方图出现明显的偏态,说明你的模型误差项可能不满足正态性假设,这会影响推断的准确性。
Tool 输入字段
Schema for plot_residual not exported yet (run pnpm export:registry).