关键词:jamovi; 非参数检验; 秩和检验; 多样本Kruskal-Wallis H检验; Kruskal-Wallis H检验; 多样本秩和检验; 事后检验
一、案例介绍
某医师对30例胆管癌患者的肿瘤直径进行了测定,其中<2cm 9例,2~3cm 11例,>3cm 10例。同时该医生对所有患者血清中糖类抗原19-9 (carbohydrate antigen19-9, CA19-9)水平(μg/L)进行了测定,问不同肿瘤直径的胆管癌患者CA19-9水平是否不同?部分数据见图1。本案例数据可从“附件下载”处下载。
二、问题分析
本案例的分析目的是比较3种不同肿瘤直径的胆管癌患者CA19-9水平是否不同。针对这种情况,可考虑使用Kruskal-Wallis H检验。Kruskal-Wallis H检验是基于秩次的非参数检验方法,用于检验多组间(也可以是两组)连续或有序分类变量是否存在差异。使用Kruskal-Wallis H检验,需要满足4个条件。
条件1:有1个观察变量和1个分组变量。本案例中胆管癌患者CA19-9水平为观察变量,肿瘤直径分组为分组变量,该条件满足。
条件2:观察变量为非正态分布或方差不齐的连续变量或有序分类变量。变量的正态性或方差齐性需要通过软件分析进行判断。
条件3:存在多个分组(k≥2)。本研究中分为3组,该条件满足。
条件4:具有相互独立的观测值。本研究中各研究对象的CA19-9水平都是独立的,不存在互相干扰的情况,该条件满足。
三、软件操作及结果解读
(一) 适用条件判断
1. 条件2判断(正态性检验)
(1) 软件操作
Kruskal-Wallis H检验时,需要分别考察每一组数据的正态性情况,因此需要使用“拆分”功能。
①选择“分析”—“探索”—“描述”,将CA选入右侧“变量”框,将group选入右侧“拆分”(图2)。
②在“绘图”中勾选“绘制Q-Q图”(图3),结果见图4。
③在“统计”分析“正态性”中勾选“Shapiro-Wilk(夏皮罗-威尔克)检验”(图5),结果见图6。
(2) 结果解读
Q-Q图(图4)和正态性检验结果(图6)按照组别列出了3组的分析结果。Q-Q图上3组散点偏离对角线较远,提示3组数据不服从正态分布;正态性检验显示3组(<2,2~3,>3)的P值分别为0.023、0.035和0.016,均<0.1,也提示3组数据不服从正态分布。
2. 条件2判断(方差齐性检验)
(1) 软件操作
①选择“分析”—“探索”—“描述”,在“离散”中勾选“标准差”和“方差”(图7),结果见图8。
②选择“分析”—“方差分析”—“单因素方差分析”,将CA选入右侧“因变量”框,将“group”选入右侧“分组变量”框(图9)。
图9
③在“适用条件判断”中勾选“方差齐性检验”,结果见图10。
(2) 结果解读
“描述”结果(图8)中“方差”结果显示,3组(<2,2~3,>3)肿瘤直径的方差分别为85.444、9639.618和23672.267,3组方差之间存在较大差异,但还需要依据统计学检验的结果进行判断。
“Homogeneity of Variances Test”(图10)为方差齐性检验结果,可见两种方法检验结果的P值均<0.1,提示3组数据方差不齐。
综上,本案例中3组连续变量数据既不服从正态分布,也不满足方差齐性,可以考虑使用Kruskal-Wallis H检验。
(二) 整体检验
1. 软件操作
选择“分析”—“方差分析”—“单因素方差分析(Kruskal-Wallis)”,将CA选入右侧“因变量”框,将group选入右侧“分组变量”框,勾选“效应量”和“DSCF两两比较)”(图11),结果见图12。
2. 结果解读
(1) 统计描述
“描述”结果(图8)提供了3组(<2,2~3,>3)数据的个案数、CA19-9的中位数、25百分位数和75百分位数。用M(P25,P75)表示,肿瘤直径<2cm的患者CA19-9水平为34.00 (32.00,40.00) μg/L,肿瘤直径2~3cm的患者CA19-9水平为367.00(325.00,381.00) μg/L,肿瘤直径>3cm的患者CA19-9水平为828.00 (796.75,957.50) μg/L。3组的CA19-9水平差异是否有统计学意义,还需要进行统计学检验进行判断。
(2) 统计学推断
“Kruskal-Wallis”(Kruskal-Wallis H检验)结果(图12)提供了Kruskal-Wallis检验分析的“χ2(统计量)”、“df(自由度)”、“P值”和“ε² (效应量)”。
可知,Kruskal-Wallis H检验分析的统计量χ2=25.748,df=2,P<0.001,可认为3种不同肿瘤直径的胆管癌患者的CA19-9水平不全相同(至少存在两组不相同)。效应值为0.888,为高效应。
(三) 事后检验(两两比较)
根据上文可知,3种不同肿瘤直径的胆管癌患者的CA19-9水平不全相同,为进一步分析是哪两组之间不同,进一步进行两两比较。
1. 软件操作
在“单因素方差分析(Kruskal-Wallis)”(图11)页面下方勾选“DSCF 两两比较”,可使用Dwass-Steel-Critchlow-Fligner检验进行两两比较,结果见图13。
2. 结果解读
“两两比较-CA”结果(图13)表格中提供了不同肿瘤直径胆管癌患者CA19-9水平两两比较的统计量W值和P值。可知,肿瘤直径<2cm和2~3cm的患者比较,CA19-9水平差异有统计学意义(W=5.320,P<0.001),肿瘤直径2~3cm和>3cm的患者比较,CA19-9水平差异有统计学意义(W=5.479,P<0.001),肿瘤直径<2cm和>3cm的患者比较,CA19-9水平差异有统计学意义(W=5.196,P<0.001)。
四、结论
本研究采用Kruskal-Wallis H检验判断不同肿瘤直径的胆管癌患者CA19-9水平是否不同。通过Q-Q图和Shapiro-Wilk检验,提示3组数据不服从正态分布;通过方差齐性检验,提示3组数据总体方差不齐,符合使用Kruskal-Wallis H检验的条件。
结果显示,肿瘤直径<2cm、2~3cm和>3cm的患者CA19-9水平分别为34.00 (32.00,40.00) μg/L、367.00(325.00,381.00) μg/L和828.00 (796.75,957.50) μg/L。Kruskal-Wallis H检验结果显示,3种不同肿瘤直径的胆管癌患者的CA19-9水平不全相同(χ2=25.748,P<0.001)。DSCF两两比较显示,不同肿瘤直径的胆管癌患者CA19-9水平均不相同。