贝叶斯回归和普通的线性回归有什么不同？

普通的线性回归只提供参数的单点估计。而贝叶斯回归通过计算后验分布，为你提供每个参数的概率区间（HDI），让你能明确看到结果的不确定性范围，而不是一个简单的结论。

如果我的数据有随机截距，应该怎么做？

在贝叶斯回归中，通过指定随机截距项，模型会自动学习每一组数据的基准偏移。这能有效防止数据合并时产生的偏差，确保模型既捕捉到了全局规律，也尊重了各组别的个体差异。

当你需要研究变量间的关系，且数据存在明显的组别差异（如不同地区、不同部门）时，使用贝叶斯回归。它能通过层次化结构同时考虑整体趋势与个体偏差，帮助你理解在考虑随机干扰的情况下，哪些因素对结果有确定的影响，并给出直观的概率预测。

在处理复杂数据时，数据点往往不是独立的。贝叶斯回归允许我们将数据分层建模，通过引入随机截距项，模型能够为不同组别分配各自的基准线，从而更准确地描述数据在组内和组间的变异。

这种方法避免了传统方法在处理嵌套数据时可能产生的“过度平滑”或“过度拟合”问题。通过利用弱信息先验，模型能从数据中自动学习组间的变异程度，使得对群体效应的估计更加符合实际。

不同于传统统计学中难懂的显著性结论，贝叶斯回归直接返回参数的后验分布。95% HDI（最高密度区间）代表了真值落在该区间的概率，这为结果解读提供了极高的直观性。

除了区间估计，我们还提供 p_direction 指标，它衡量了参数大于零或小于零的概率。当该值超过 0.95 时，意味着影响的方向性具有高度的确定性，这为你的决策提供了坚实的证据支撑。

贝叶斯回归通过 NUTS 采样器生成后验分布，因此收敛性检查至关重要。Lattice 会自动检查 r_hat 和有效样本量（ESS）指标，确保采样过程稳定，生成的结论具备可靠的统计学意义。

如果在分析过程中发现不收敛，这通常提示数据规模不足或模型复杂度过高。系统会提供对应的诊断信息与行动建议，帮助你通过调整参数或模型结构获取稳健的计算结果。

为了提高采样效率和后验分布的可解释性，本方法默认会对自变量和因变量进行标准化（z-score）。这不仅能改善模型求解器的几何特性，还能让你直接比较不同量级变量对结果的影响权重。

所有输出的回归系数均在标准化尺度下展示。如果你需要回到原始量纲，模型记录的变换信息确保了结果的可追溯性，满足科研与业务分析的严谨要求。

1 · Intent → method

An LLM picks bayesian_regression from a fixed catalog.

2 · Method → numbers

Deterministic Python engine runs the math. Same input → same output.

3 · Numbers → plain language

A second LLM translates the result into your domain’s vocabulary.

贝叶斯回归和普通的线性回归有什么不同？
普通的线性回归只提供参数的单点估计。而贝叶斯回归通过计算后验分布，为你提供每个参数的概率区间（HDI），让你能明确看到结果的不确定性范围，而不是一个简单的结论。
如果我的数据有随机截距，应该怎么做？
在贝叶斯回归中，通过指定随机截距项，模型会自动学习每一组数据的基准偏移。这能有效防止数据合并时产生的偏差，确保模型既捕捉到了全局规律，也尊重了各组别的个体差异。

Schema for bayesian_regression not exported yet (run pnpm export:registry).