Lattice 提供了一系列基于决策树与深度学习的预测性建模工具，包括随机森林、XGBoost 和神经网络。我们的三阶段架构确保了分析的严谨性：首先，LLM 根据您的业务目标意图智能调度合适的算法；接着，确定性执行引擎利用预设的随机种子执行数学计算，确保在相同参数下得到完全一致的结果；最后，LLM 将复杂的模型输出翻译为易懂的见解，并引入反幻觉检查机制，通过过拟合、数据不足、类别不平衡等关键旗标，提醒您评估结果的可靠性。与传统统计方法不同，本系列工具主要关注预测准确性与特征的关联强度，无需预先设定严苛的分布假设，让您能直接处理具有交互作用的现实数据。

何时选择这一家族

您拥有超过 200 行记录，且目标是基于多变量特征预测数值或类别
您不需要推断因果关系，而是希望找出影响预测结果的核心驱动变量
您的数据存在复杂的非线性交互，简单的线性回归无法捕捉实际模式
您希望通过自动化的归因手段来解释模型关注的特征权重

机器学习如何运作

本系列工具通过构建多种模型（如集成决策树或多层感知机）来拟合数据特征与目标之间的复杂映射。模型在训练过程中会自动捕捉变量间的非线性关系，不再需要人工手动逐一验证变量交互。

核心产出包括泛化能力评估（R² 或 Accuracy）及基于 SHAP 的特征重要度。SHAP 值能够量化每个特征对预测结果的推波助澜或抵消作用，不仅告诉您哪些变量重要，还能指出它们提升或降低预测值的具体方向。

与统计建模的区别

相较于侧重推断统计参数显著性的回归分析，机器学习工具集更倾向于处理预测准确性。统计模型通常对分布有明确假设，而本系列方法更灵活，能够应对包含噪声与非线性结构的真实数据集。

在解释性方面，统计方法提供具体的系数效应量，适用于解释因果逻辑；而我们的工具提供关联层面的重要性排序，适合从大规模数据集中快速锁定关键信息，而非直接推断干预带来的因果改变。

避免常见失误

初学者常混淆相关性与因果关系。机器学习模型捕捉的是数据关联，当您看到某特征排序靠前时，应将其视为关联强度的体现，而非证明该变量就是导致结果的原因。

另一个常见问题是忽视反幻觉旗标。如果系统提示样本量不足或存在严重的类不均衡，请务必参考建议调整数据量或评价指标，否则模型输出的 Accuracy 往往会掩盖严重的逻辑偏差。

常见问题

为什么我的机器学习模型结果每次跑出来的 SHAP 值都是一样的？: 这是 Lattice 的核心设计。我们通过固定全局 random_seed 并确保底层工具在确定性模式下运行，消除了随机性带来的偏差。这意味着无论您运行多少次，计算过程均保持字节级的一致，确保您的分析结论在反复验证中是稳定的。
当我看到系统返回了 'overfit_concern' 警告时，我该怎么做？: 当训练集表现远好于测试集时会触发此旗标。这意味着模型记住了数据中的噪声而非规律。您可以尝试收集更多数据，或者在工具配置中限制树的深度、增加正则化强度，避免模型对训练样本过度拟合。

机器学习

何时选择这一家族

机器学习如何运作

与统计建模的区别

避免常见失误

常见问题

这一家族下的方法

CART 决策树分析 | Lattice 可解释性机器学习工具

线性判别分析 | LDA 分类建模 | Lattice 数据分析

神经网络分类器：复杂模式预测与特征重要度分析 | Lattice

随机森林分类器 | Lattice 数据分析

XGBoost 梯度提升 | Lattice 高效预测建模与特征分析