当您有多位评分者对同一批对象进行评价,或通过多种测量方式获取数据时,组内相关系数 ICC 能帮助您判断这些评分结果是否高度一致。它适用于心理测评、临床诊断及性能评估,是确保测量系统稳定性不可或缺的分析工具。
为什么选择 组内相关系数 ICC
在处理多维度评分数据时,直接计算相关性往往忽略了评分者之间可能存在的系统偏差。组内相关系数 ICC 通过方差分量模型,同时考虑了被评价对象的差异和评分者的测量误差,从而提供一个单一的、客观的可靠性指标。
与简单的相关系数不同,ICC 能够处理多于两名评分者的复杂场景,并且对数据中存在的系统偏移更为敏感。它是心理测量学和医学研究中评估量表质量的基准方法。
理解评分系统的一致性
当数据进入 Lattice 平台后,您可以选择不同的模型(如单测量或平均测量)来适应您的分析需求。系统会根据数据的长格式(long-format)或宽格式(wide-format)自动调整计算逻辑,确保评分过程被准确建模。
通过分析 95% 置信区间的下界,您可以更保守且准确地评估系统的最坏情况。这种做法避免了对评分结果盲目乐观,确保您在进行科学研究或质量控制时做出稳健的决策。
数据要求与前置条件
为了保证分析结论的有效性,我们建议评分对象的数量不少于 5 个,且至少有 2 位评分者参与。对于包含重复测量或多评分者的复杂设计,请确保数据集中不包含重复的行记录。
Lattice 在执行计算前会自动校验数据的完整性,如果发现缺失值,系统会通过剔除相应行的方式来维护模型的平衡性,从而确保计算过程严谨且符合学术标准。
1 · Intent → method
An LLM picks reliability_icc from a fixed catalog.
2 · Method → numbers
Deterministic Python engine runs the math. Same input → same output.
3 · Numbers → plain language
A second LLM translates the result into your domain’s vocabulary.
什么是 组内相关系数 ICC 的数值判读?
根据业界通用的判读准则,ICC 值低于 0.50 表示可靠性较差;0.50 至 0.75 为中等;0.75 至 0.90 为良好;0.90 以上则代表极佳的评分一致性。
为什么计算出的 组内相关系数 ICC 会出现负值?
当数据间的组内变异大于总变异,即评分者的评价差异远大于对象间的实际差异时,计算结果可能会出现负数。在 Lattice 中,系统会自动将该数值归零,以保证结果在逻辑意义上有效。
Tool 输入字段
Schema for reliability_icc not exported yet (run pnpm export:registry).