方法

时序分析

时序分析工具集适用于需要解读数据随时间变化规律的场景,例如评估运营指标的周期性波动、分析生产工艺的良率变动,或检测关键业务调整后的突变点。无论是质量控制人员还是科研分析者,均可利用本工具直接获取趋势方向、周期性特征及自动化的短期预测结论。

在时序分析中,Lattice 通过三阶段处理架构确保分析的严谨性与直观性。首先,LLM 根据用户对数据的描述挑选最适配的统计工具(如趋势检测或季节性识别);接着,确定性计算引擎(基于 Scipy 和 Pymannkendall 等)在处理数据时自动完成预处理、双向统计检验及模型定阶,完全排除人为干预;最后,LLM 将复杂的统计指标如 Mann-Kendall Z 分数或 ARIMA 预测参数转化为用户易懂的自然语言建议。这种架构确保了分析过程不仅保留了学术统计的严密性,更能在无需深度学习调参的情况下,即刻响应用户关于数据变化趋势的业务质询。

何时选择这一家族

如何理解时序分析的核心功能

本系列方法涵盖了时序数据的描述性分析与预测性建模。通过趋势检测,系统会并行运行线性回归与非参数化的 Mann-Kendall 检验,旨在即使在数据分布非正态或存在异常值时,依然能提供稳定的趋势方向判断。

在季节性识别上,系统通过 STL 分解法将观测值拆解为趋势、周期和残差三个分量。这种方式不仅能告诉你数据是否具有周期性,还能展示每个周期分量的具体形态,辅助判断业务波动是季节性规律还是外部因素导致的干扰。

时序分析与常规回归分析的区别

虽然线性回归在很多统计分析中都会出现,但本系列方法的核心在于对“时间依赖性”的处理。常规回归假设观测值独立同分布,而时序工具集通过对时间列的严格解析、自动排序以及针对波动特性的专门建模(如 ARIMA),处理的是观测值随时间演变的动态特性。

我们刻意排除了需要大量超参数调优的深度学习方法(如 LSTM),转而通过确定性的统计方法提供更具可解释性的结果。这种设计确保了当你分析工艺良率或市场销量时,结论是基于统计规律的推断,而非黑盒预测。

避免常见的分析误区

初学者常忽略数据的时间属性,例如未按时间顺序排列或时间戳包含缺失值。Lattice 引擎内置了自动排序与缺失值处理机制,但在数据解读时,务必注意我们给出的“功效警告”——当样本量较少时,统计检验的灵敏度会下降,这时应谨慎看待显著性结论。

另一个误区是混淆“相关性”与“因果性”。我们的工具可以量化趋势是否存在或波动是否具有周期性,但这些指标并不能直接替代业务逻辑的解释。分析结果应当作为业务判断的辅助,而非直接关联因果的定论。

常见问题

如果线性回归的结果和 Mann-Kendall 的结果不一致,我该信哪一个?
当两者结论不一致时,Lattice 会在输出中提示。通常情况下,Mann-Kendall 检验因为是非参数的,对异常值更稳健,其趋势结果在复杂现实业务中往往更可靠。建议优先参考工具返回的 `trend_direction` 综合判断字段。
为什么我的时序数据分析总是提示需要至少 4 个或 10 个数据点?
这是基于统计检验的有效性要求。MK 趋势检验的底层数学原理至少需要 4 个观测值才能计算;当样本量不足 10 个时,统计效力显著降低,结果极易产生伪趋势。为了保证分析结论不产生误导,系统会强制要求或给出警告。

这一家族下的方法