Question 1

随机森林分类器如何衡量变量的重要性？

Accepted Answer

该方法通过三种视角提供重要性指标：MDI（基于决策过程的贡献度）、Permutation（测试集数据随机打乱后的表现下降量）以及 SHAP（基于精确算法计算的局部与全局归因），系统会优先展示 SHAP 值以提供最准确的方向性解释。

Question 2

如果我的数据样本量很少，使用该方法会有问题吗？

Accepted Answer

如果样本量少于 50 条，系统会触发 low_data_concern 预警。由于机器学习模型需要足够的数据来学习模式，样本过少可能导致预测不稳定，此时建议考虑增加样本量或改用经典的统计建模方法。

Question 3

什么是“反幻觉 post-check”？

Accepted Answer

这是 Lattice 提供的质量保障机制。在使用随机森林分类器后，系统会自动检查模型是否存在过拟合、样本量不足或类别极度不均衡的情况，并在发现问题时自动生成警告，防止你基于不可靠的模型得出误导性结论。

随机森林分类器 | Lattice 数据分析

基于多维视角的归因分析