数据可视化

散点图 | 变量相关性分析工具 | Lattice

散点图通过将数据点投射在坐标轴上,帮助你直观观察两个数值变量之间是否存在关联。当你需要判断变量是否同步变化、寻找数据中的异常离群点,或初步探索多组数据的分布差异时,它是最直观的选择。

直观洞察变量间的关系

散点图的核心价值在于将复杂的数据集转化为直观的几何图形。通过将两个数值列映射到水平轴与垂直轴上,每一个数据点都代表了一个样本在两个维度上的取值。

这种方式能让你迅速判断变量间的协同倾向。如果点群呈现出向上的斜线趋势,说明变量间存在正相关;若点群散布无规律,则提示变量间可能不存在显著的线性关系。

灵活的多维度数据探索

除了基础的坐标呈现,你可以利用分组着色功能,在同一图表中区分不同的样本群体。这对于观察不同类别数据在相同坐标系下的位置差异非常有效。

此外,Lattice 支持面板拆分功能。通过指定一个分类列,你可以将散点图自动拆分为多个独立的子图,从而在不同的维度下横向对比数据分布,揭示隐藏在全局数据之下的局部规律。

保持数据的纯粹性

作为一种确定性的分析工具,散点图在处理过程中遵循严格的数据保护原则。系统不会对原始数据进行任何插补或修改,确保你看到的每一个点都真实反映了原始 CSV 文件中的记录。

无论是面对大规模的离群点排查,还是进行精细化的分组对比,散点图都以其清晰的几何展现方式,为你提供可靠的分析依据。

1 · Intent → method

An LLM picks plot_scatter from a fixed catalog.

2 · Method → numbers

Deterministic Python engine runs the math. Same input → same output.

3 · Numbers → plain language

A second LLM translates the result into your domain’s vocabulary.

  • 散点图如何处理缺失值?

    为了保证数据的对齐准确,散点图采用列表式删除策略。如果某一行中的 X 轴或 Y 轴数据存在缺失,该行数据将被跳过,确保最终呈现的每一组坐标点都是有效的对应关系。

  • 为什么我的散点图无法显示所有分组?

    当使用面板拆分功能时,为了保持图表的可读性,散点图会自动保留观测数量最多的前 12 个组别。如果你的数据分类超过该限制,系统会提供相关提示,以防止图表信息过于拥挤。

Tool 输入字段

Schema for plot_scatter not exported yet (run pnpm export:registry).