医咖会|还不会组内相关系数(ICC)?来看这篇SPSS详细教程!


组内相关系数(intraclass correlation efficient, ICC)常用于评价具有确定亲属关系(如双胞胎、兄弟姐妹等)的个体间某种定量属性的相似程度 , 也应用于评价不同测定方法或评定者对同一定量测量结果的可重复性或一致性 。 在诊断试验中 , 我们也常常使用ICC指标评价不同研究者对同一组试验结果进行诊断的可重复性 。
一、问题与数据
现假设有2位研究者使用相同的诊断试验分别测量25位受试者的血糖水平 。 部分原始数据见表1 。
表1 部分原始数据

医咖会|还不会组内相关系数(ICC)?来看这篇SPSS详细教程!
本文插图
当然 , 为了评价该诊断试验的可重复性 , 我们可以设置一个诊断截点 , 人为地将血糖水平转换成二分类变量 , 再运用之前讲过的Kappa分析进行判断 。 但是 , 将连续变量转换成二分类变量会丢失信息 。 那我们应该如何做呢?
接下来 , 我们将向大家介绍诊断试验组内相关系数的分析方法 , 以SPSS统计软件为例 。
二、SPSS分析方法
1. 数据录入SPSS

医咖会|还不会组内相关系数(ICC)?来看这篇SPSS详细教程!
本文插图
2. 选择Analyze→ Scale→ Reliability Analysis

医咖会|还不会组内相关系数(ICC)?来看这篇SPSS详细教程!
本文插图
3. 选项设置
(1)主对话框设置
我们将待观测的两组数据分别放入Items框中 。

医咖会|还不会组内相关系数(ICC)?来看这篇SPSS详细教程!
本文插图
(2)Statistics设置
点击Statistics , 选中Intraclass correlation coefficient 。
Model的设置:
组内相关系数的计算有三种模型 , 分别是One-way random、Two-way random和Two-way mixed 。 其中 , One-way random模型用于检验每一个受试者的均值是否完全相等 , 不应用于评价诊断试验的可重复性 。 而Two-way random模型与Two-way mixed模型相似 , 它们同时考虑了受试者和研究者的影响 , 在理论上都可以用于诊断试验可重复性的评价 。 但是这两种模型结果的推论范围存在差异 。 Two-way random模型的结果可以推论到所有相似、可能的研究者;而Two-way mixed模型的结果仅限于给定的研究者 , 不能推论其他 。
因此 , 诊断试验可重复性评价应选择Two-way random模型 。
评价类型的设置:Two-way random模型有absolute agreement和consistency两种计算类型 。 其中 , absolute agreement考虑研究者的系统误差 , 可用于测量不同研究者是否给予受试者相同的绝对值 。 而consistency并不考虑研究者的系统误差 , 仅适用于评价不同研究者之间的评分是否高度相关 。
具体来说 , 如果我们现有2、4、6和4、6、8两组结果 , 绝对值并不相等 , 用absolute agreement计算ICC值仅为0.67(只有4、6两个绝对值是相同的);但是这两组结果却高度相关 , 用consistency计算ICC值为1(这两组数字高度相关) 。
针对诊断试验的可重复性评价来说 , 我们希望不同研究者得到一致的结果 , 而不是仅仅是“高度相关” 。 因此 , 我们应该选择absolute agreement计算类型 。

医咖会|还不会组内相关系数(ICC)?来看这篇SPSS详细教程!
本文插图
→ Continue→ 回到主界面→ OK
三、结果解读
SPSS组内相关系数的计算结果有3个表格 , 我们仅需要重点关注其中一个 , 如下:

医咖会|还不会组内相关系数(ICC)?来看这篇SPSS详细教程!
本文插图
这个表给出了组内相关系数的两种估计结果 , Single Measures和Average Measures 。 这两种估计结果有什么区别呢?Single Measures的分析单位是每个研究者的结果 , 可以估计单个研究者的情况 。 而Average Measures的分析单位是多个研究者研究结果的均值 , 应用范围受到局限 。分页标题
【医咖会|还不会组内相关系数(ICC)?来看这篇SPSS详细教程!】因此 , 我们依据Single Measures的估计结果判断诊断试验可重复性评价的组内相关系数 , 即ICC=0.987(P<0.001) 。
四、 撰写结论
一般来说 , ICC值介于0到1之间 。 就诊断试验而言 , 如果ICC值小于0.4 , 我们认为诊断试验的可重复性较差;如果ICC值大于0.75 , 那么诊断试验的可重复性较好 。
综上 , 该血糖水平诊断试验的ICC值为0.987(P<0.001) , 可重复性较好 。
1. Mcgraw K O, Wong S P. Forming inferences about some intraclass correlation coefficients.[J]. Psychological Methods, 1996, 1(4):390-390.
2. Shrout P E, Fleiss J L. Intraclass correlations: uses in assessing rater reliability.[J]. Psychological Bulletin, 1979, 86(2):420.
推荐医咖会专栏课程《如何理解临床实践指南的证据质量与推荐强度》!
讲解临床实践指南指定过程中 , 如何检索证据、如何进行系统评价、如何采用GRADE系统对证据质量和推荐意见强度进行分级以及共识法应用的流程和关键点 。
使用电脑 , 打开医咖会 , 观看专栏视频: