在时序分析中,Lattice 通过三阶段处理架构确保分析的严谨性与直观性。首先,LLM 根据用户对数据的描述挑选最适配的统计工具(如趋势检测或季节性识别);接着,确定性计算引擎(基于 Scipy 和 Pymannkendall 等)在处理数据时自动完成预处理、双向统计检验及模型定阶,完全排除人为干预;最后,LLM 将复杂的统计指标如 Mann-Kendall Z 分数或 ARIMA 预测参数转化为用户易懂的自然语言建议。这种架构确保了分析过程不仅保留了学术统计的严密性,更能在无需深度学习调参的情况下,即刻响应用户关于数据变化趋势的业务质询。
何时选择这一家族
- 你拥有一列带时间戳的数据,并想判断指标整体是在增长、下降还是保持稳定。
- 你观察到数据存在重复波动,希望量化其季节性强度或确定具体的周期长度。
- 你试图在已知的时间点前后对比数据表现,并确认是否存在显著的统计学突变。
- 你希望基于历史短期数据,通过自回归模型推测下一阶段的可能走势。
如何理解时序分析的核心功能
本系列方法涵盖了时序数据的描述性分析与预测性建模。通过趋势检测,系统会并行运行线性回归与非参数化的 Mann-Kendall 检验,旨在即使在数据分布非正态或存在异常值时,依然能提供稳定的趋势方向判断。
在季节性识别上,系统通过 STL 分解法将观测值拆解为趋势、周期和残差三个分量。这种方式不仅能告诉你数据是否具有周期性,还能展示每个周期分量的具体形态,辅助判断业务波动是季节性规律还是外部因素导致的干扰。
时序分析与常规回归分析的区别
虽然线性回归在很多统计分析中都会出现,但本系列方法的核心在于对“时间依赖性”的处理。常规回归假设观测值独立同分布,而时序工具集通过对时间列的严格解析、自动排序以及针对波动特性的专门建模(如 ARIMA),处理的是观测值随时间演变的动态特性。
我们刻意排除了需要大量超参数调优的深度学习方法(如 LSTM),转而通过确定性的统计方法提供更具可解释性的结果。这种设计确保了当你分析工艺良率或市场销量时,结论是基于统计规律的推断,而非黑盒预测。
避免常见的分析误区
初学者常忽略数据的时间属性,例如未按时间顺序排列或时间戳包含缺失值。Lattice 引擎内置了自动排序与缺失值处理机制,但在数据解读时,务必注意我们给出的“功效警告”——当样本量较少时,统计检验的灵敏度会下降,这时应谨慎看待显著性结论。
另一个误区是混淆“相关性”与“因果性”。我们的工具可以量化趋势是否存在或波动是否具有周期性,但这些指标并不能直接替代业务逻辑的解释。分析结果应当作为业务判断的辅助,而非直接关联因果的定论。
常见问题
- 如果线性回归的结果和 Mann-Kendall 的结果不一致,我该信哪一个?
- 当两者结论不一致时,Lattice 会在输出中提示。通常情况下,Mann-Kendall 检验因为是非参数的,对异常值更稳健,其趋势结果在复杂现实业务中往往更可靠。建议优先参考工具返回的 `trend_direction` 综合判断字段。
- 为什么我的时序数据分析总是提示需要至少 4 个或 10 个数据点?
- 这是基于统计检验的有效性要求。MK 趋势检验的底层数学原理至少需要 4 个观测值才能计算;当样本量不足 10 个时,统计效力显著降低,结果极易产生伪趋势。为了保证分析结论不产生误导,系统会强制要求或给出警告。