Kruskal-Wallis H检验(Kruskal-Wallis H Test) ——jamovi软件实现

发布于 2023年2月10日 星期五 11:03:25 浏览:948
原创不易,转载请注明来源,感谢!
附件下载:
Kruskal-Wallis H检验.zip 请勿重复点击,如无响应请耐心等待或稍后再试。

在前面文章中介绍了“Kruskal-Wallis H检验(Kruskal-Wallis H Test)的假设检验理论”,本文将实例演示在jamovi软件中实现Kruskal-Wallis H检验的操作步骤。

关键词:jamovi; 非参数检验; 秩和检验; 多样本Kruskal-Wallis H检验; Kruskal-Wallis H检验; 多样本秩和检验; 事后检验

一、案例介绍

某医师对30例胆管癌患者的肿瘤直径进行了测定,其中<2cm 9例,2~3cm 11例,>3cm 10例。同时该医生对所有患者血清中糖类抗原19-9 (carbohydrate antigen19-9, CA19-9)水平(μg/L)进行了测定,问不同肿瘤直径的胆管癌患者CA19-9水平是否不同?部分数据见图1。本案例数据可从“附件下载”处下载。

图1

二、问题分析

本案例的分析目的是比较3种不同肿瘤直径的胆管癌患者CA19-9水平是否不同。针对这种情况,可考虑使用Kruskal-Wallis H检验。Kruskal-Wallis H检验是基于秩次的非参数检验方法,用于检验多组间(也可以是两组)连续或有序分类变量是否存在差异。使用Kruskal-Wallis H检验,需要满足4个条件。

条件1:有1个观察变量和1个分组变量。本案例中胆管癌患者CA19-9水平为观察变量,肿瘤直径分组为分组变量,该条件满足。

条件2:观察变量为非正态分布或方差不齐的连续变量或有序分类变量。变量的正态性或方差齐性需要通过软件分析进行判断。

条件3:存在多个分组(k≥2)。本研究中分为3组,该条件满足。

条件4:具有相互独立的观测值。本研究中各研究对象的CA19-9水平都是独立的,不存在互相干扰的情况,该条件满足。

三、软件操作及结果解读

(一) 适用条件判断

1. 条件2判断(正态性检验)

(1) 软件操作

Kruskal-Wallis H检验时,需要分别考察每一组数据的正态性情况,因此需要使用“拆分”功能。

①选择“分析”—“探索”—“描述”,将CA选入右侧“变量”框,将group选入右侧“拆分”(图2)。

图2

②在“绘图”中勾选“绘制Q-Q图”(图3),结果见图4。

图3
图4

③在“统计”分析“正态性”中勾选“Shapiro-Wilk(夏皮罗-威尔克)检验”(图5),结果见图6。

图5
图6
(2) 结果解读

Q-Q图(图4)和正态性检验结果(图6)按照组别列出了3组的分析结果。Q-Q图上3组散点偏离对角线较远,提示3组数据不服从正态分布;正态性检验显示3组(<2,2~3,>3)的P值分别为0.023、0.035和0.016,均<0.1,也提示3组数据不服从正态分布。

2. 条件2判断(方差齐性检验)

(1) 软件操作

①选择“分析”—“探索”—“描述”,在“离散”中勾选“标准差”和“方差”(图7),结果见图8。

图7
图8

②选择“分析”—“方差分析”—“单因素方差分析”,将CA选入右侧“因变量”框,将“group”选入右侧“分组变量”框(图9)。

图9

图9

③在“适用条件判断”中勾选“方差齐性检验”,结果见图10。

图10
(2) 结果解读

“描述”结果(图8)中“方差”结果显示,3组(<2,2~3,>3)肿瘤直径的方差分别为85.444、9639.618和23672.267,3组方差之间存在较大差异,但还需要依据统计学检验的结果进行判断。

“Homogeneity of Variances Test”(图10)为方差齐性检验结果,可见两种方法检验结果的P值均<0.1,提示3组数据方差不齐。

综上,本案例中3组连续变量数据既不服从正态分布,也不满足方差齐性,可以考虑使用Kruskal-Wallis H检验。

(二) 整体检验

1. 软件操作

选择“分析”—“方差分析”—“单因素方差分析(Kruskal-Wallis)”,将CA选入右侧“因变量”框,将group选入右侧“分组变量”框,勾选“效应量”和“DSCF两两比较)”(图11),结果见图12。

图11
图12

2. 结果解读

(1) 统计描述

“描述”结果(图8)提供了3组(<2,2~3,>3)数据的个案数、CA19-9的中位数、25百分位数和75百分位数。用M(P25,P75)表示,肿瘤直径<2cm的患者CA19-9水平为34.00 (32.00,40.00) μg/L,肿瘤直径2~3cm的患者CA19-9水平为367.00(325.00,381.00) μg/L,肿瘤直径>3cm的患者CA19-9水平为828.00 (796.75,957.50) μg/L。3组的CA19-9水平差异是否有统计学意义,还需要进行统计学检验进行判断。

(2) 统计学推断

“Kruskal-Wallis”(Kruskal-Wallis H检验)结果(图12)提供了Kruskal-Wallis检验分析的“χ2(统计量)”、“df(自由度)”、“P值”和“ε² (效应量)”。

可知,Kruskal-Wallis H检验分析的统计量χ2=25.748,df=2,P<0.001,可认为3种不同肿瘤直径的胆管癌患者的CA19-9水平不全相同(至少存在两组不相同)。效应值为0.888,为高效应。

(三) 事后检验(两两比较)

根据上文可知,3种不同肿瘤直径的胆管癌患者的CA19-9水平不全相同,为进一步分析是哪两组之间不同,进一步进行两两比较。

1. 软件操作

在“单因素方差分析(Kruskal-Wallis)”(图11)页面下方勾选“DSCF 两两比较”,可使用Dwass-Steel-Critchlow-Fligner检验进行两两比较,结果见图13。

图13

2. 结果解读

“两两比较-CA”结果(图13)表格中提供了不同肿瘤直径胆管癌患者CA19-9水平两两比较的统计量W值和P值。可知,肿瘤直径<2cm和2~3cm的患者比较,CA19-9水平差异有统计学意义(W=5.320,P<0.001),肿瘤直径2~3cm和>3cm的患者比较,CA19-9水平差异有统计学意义(W=5.479,P<0.001),肿瘤直径<2cm和>3cm的患者比较,CA19-9水平差异有统计学意义(W=5.196,P<0.001)。

四、结论

本研究采用Kruskal-Wallis H检验判断不同肿瘤直径的胆管癌患者CA19-9水平是否不同。通过Q-Q图和Shapiro-Wilk检验,提示3组数据不服从正态分布;通过方差齐性检验,提示3组数据总体方差不齐,符合使用Kruskal-Wallis H检验的条件。

结果显示,肿瘤直径<2cm、2~3cm和>3cm的患者CA19-9水平分别为34.00 (32.00,40.00) μg/L、367.00(325.00,381.00) μg/L和828.00 (796.75,957.50) μg/L。Kruskal-Wallis H检验结果显示,3种不同肿瘤直径的胆管癌患者的CA19-9水平不全相同(χ2=25.748,P<0.001)。DSCF两两比较显示,不同肿瘤直径的胆管癌患者CA19-9水平均不相同。

End
文章目录 沉浸式阅读