Kruskal-Wallis H检验(Kruskal-Wallis H Test)——SPSS软件实现

发布于 2022年1月2日 星期日 21:25:00 浏览:33090
原创不易,转载请注明来源,感谢!
附件下载:
多样本Kruskal-Wallis H检验.zip 请勿重复点击,如无响应请耐心等待或稍后再试。

在上一篇文章中我们介绍了Kruskal-Wallis H检验的假设检验理论,本篇文章将使用同样的案例演示在SPSS软件中实现Kruskal-Wallis H检验的操作步骤。

关键词:SPSS; 非参数检验; 秩和检验; 多样本Kruskal-Wallis H检验; Kruskal-Wallis H检验; 多样本秩和检验; 事后检验

一、案例介绍

某医师对30名胆管癌患者的肿瘤直径进行了测定,其中9名患者肿瘤直径<2cm,11名患者肿瘤直径为2~3cm,10名患者肿瘤直径>3cm。同时该医生对所有患者血清中癌抗原19-9 (cancer antigens 19-9,CA19-9)水平(μg/L)进行了测定,问不同肿瘤直径的胆管癌患者CA19-9水平是否不同?

创建代表组别的数值型变量“group(组别)”,将胆管癌患者按肿瘤直径<2cm、2~3cm和>3cm分成3组,分别赋值为“1”、“2”、“3”,变量测量尺度设为“名义”。创建记录患者血清中CA19-9水平的数值型变量“CA”,测量尺度设为“标度”。部分数据见图1。本文案例可从“附件下载”处下载。

图1

二、问题分析

本案例的分析目的是比较三种不同肿瘤直径的胆管癌患者CA19-9水平是否不同。针对这种情况,可考虑使用Kruskal-Wallis H检验。Kruskal-Wallis H检验是基于秩次的非参数检验方法,用于检验多组间(也可以是两组)连续或有序分类变量是否存在差异。使用Kruskal-Wallis H检验,需要满足4个条件。

条件1:有一个观察变量和一个分组变量,在本案例中胆管癌患者CA19-9水平为观察变量,肿瘤直径分组为分组变量,该条件满足。

条件2:观察变量为非正态分布或方差不齐的连续变量或有序分类变量,变量的正态性或方差齐性需要通过软件分析进行判断。

条件3:存在多个分组(k≥2)。本研究中分为三组,该条件满足。

条件4:具有相互独立的观测值。本研究中各研究对象的CA19-9水平都是独立的,不存在互相干扰的情况,该条件满足。

三、软件操作及结果解读

(一) 适用条件判断

1. 条件2判断(正态性检验)

(1) 软件操作

①选择“分析”—“描述统计”—“探索”(图2)。

图2

②在“探索”对话框中将观察变量“CA”选入右侧“因变量列表”框,将分组变量“group”选入右侧“因子列表”框(图3)。

图3

③在“图”子对话框中勾选“含检验的正态图”,取消勾选“茎叶图”,其他不变,如图4所示,点击“继续”,回到“探索”对话框,点击“确定”,即可得到正态性检验结果。

图4
(2) 结果解读

图5是对三组数据的“描述”结果,包括变量“CA”的“平均值”、“平均值的95%置信区间”、“中位数”、“标准偏差”、“四分位距”等指标。可知肿瘤直径<2cm、2~3cm和>3cm的三组患者的CA19-9水平的中位数(四分位距)分别为34.00 (12.00) μg/L、367.00 (60.00) μg/L和828.00 (222.00) μg/L。

图5

图6显示了两种正态性检验的结果,柯尔莫哥洛夫-斯米诺夫,K-S检验和夏皮罗-威尔克正态性,S-W检验。K-S检验适用于大样本资料,本案查看S-W检验结果,三组P值分别为0.023、0.035和0.016,均<0.1,提示三组数据均不服从正态分布。图7-1、图7-2和图7-3分别是三组数据的Q-Q图,散点都偏离对角线较远,也提示三组数据均不服从正态分布。关于正态性检验的注意事项详见文章(医学统计学核心概念及重要假设检验的软件实现(2/4)——正态性假设检验的SPSS实现)。

图6
图7-1
图7-2
图7-3

2. 条件2判断(方差齐性检验)

(1) 软件操作

①选择“分析”—“比较平均值”—“单因素ANOVA检验” (图8)。

图8

②在“单因素ANOVA检验”对话框中将变量“CA”选入右侧“因变量列表”框,将变量“group”选入右侧“因子”框(图9)。

图9

③在“选项”对话框中勾选“方差齐性检验”后点击“继续”(图10),回到“单因素ANOVA检验”对话框后点击“确定”,则得到方差齐性检验结果。

图10
(2) 结果解读

图11是“方差齐性检验”结果,可知“基于平均值的莱文统计” F=7.192,P=0.003<0.1,提示三组数据方差不齐。关于方差齐性检验的更多内容请阅读(医学统计学核心概念及重要假设检验的软件实现(4/4)——方差齐性检验及SPSS实现)。

图11

综上,本案例中三组数据既不服从正态分布,也不满足方差齐性,可以考虑使用Kruskal-Wallis H检验。

(二) 整体检验

1. 软件操作

①选择“分析”—“非参数检验”—“独立样本”(图12)。

图12

②在“非参数检验”对话框的“目标”选项卡中,选择“定制分析”(图13)。

图13

③在“字段”选项卡中将观察变量“CA”选入右侧“检验字段”框,分组变量“group”选入右侧“组”框(图14)。

图14

④在“设置”选项卡中选择“定制检验”,然后勾选该对话框下的“克鲁斯卡尔-沃利斯单因素ANOVA检验(k个样本)”,在该选项下的“多重比较”选择框中选择“全部成对”,即对所有组别进行两两比较。再点击“运行”(图15)即可得到检验结果。

图15

2. 结果解读

(1) 统计描述

由图5可知肿瘤直径<2cm、2~3cm和>3cm的三组患者的CA19-9水平分别为34.00 (12.00) μg/L、367.00 (60.00) μg/L和828.00 (222.00) μg/L。三组的CA19-9水平看似存在差异,但还需要依据统计学检验的结果进行判断。

(2) 统计学推断

图16为“假设检验摘要”,列出了本次检验的“原假设”、“检验”、“显著性”和“决策”,结果为P<0.001,拒绝原假设。

图16

图17显示了“独立样本克鲁斯卡尔-沃利斯检验”的详细结果,上方表格呈现了本次检验的“总计”为30,“检验统计”为H=25.748,“自由度”为2,“渐进显著性(双侧检验)”<0.001,该P值与图17中一致,可以认为三组不同肿瘤直径的胆管癌患者的CA19-9水平不全相同(至少存在两组不相同) ,下方箱式图反映了各组的CA19-9中位数和分布情况。

图17

(三) 事后检验(两两比较)

虽然得到了“三种不同肿瘤直径的胆管癌患者的CA19-9水平不全相同”的结论,但若要清楚了解到底是哪些组别不同,则需要进一步进行两两比较。

1. 软件操作

操作步骤同上述整体检验的软件操作步骤,其中步骤④,在“多重比较”选项框中选择“全部成对”(图15),即表示要进行事后两两比较。

2. 结果解读

图18上方呈现了两两比较的结果,由于是事后分析,所以需要调整显著性水平后对结果进行判断。表格下方的说明显示此处是依据Bonferroni法进行调整,即调整后的显著性水平=原显著性水平/比较次数。本研究共比较了3次,所以调整后的显著性水平为0.05/3=0.017。表格中显著性列即统计检验的P值,需要和0.017比较,小于0.017则认为差异有统计学意义。此处三次比较的P值均小于0.017。表格中还显示了“Adj.显著性”,即调整后P值,该列是将显著性列乘以比较次数得到,因此可以直接和0.05比较,小于0.05则认为差异有统计学意义。此处均小于0.05,与显著性列结果一致,所以认为三种不同肿瘤直径的胆管癌患者的CA19-9水平均不相同。

下方为比较结果示意图,圆点旁的数值代表组别和该组的平均秩次。点与点之间的连接线代表统计检验结果,黄色代表两组差异有统计学意义,黑色代表两组差异无统计学意义。此图中有三条黄色连接线,表示每两组之间均存在差异。

图18

四、结论

本研究采用Kruskal-Wallis H检验判断肿瘤直径<2cm、2~3cm和>3cm的胆管癌患者CA19-9含量是否不同。通过Q-Q图和Shapiro-Wilk检验,提示三组数据均不服从正态分布;通过Levene’s检验,提示三组数据总体方差不齐,符合使用Kruskal-Wallis H检验的条件。

统计结果显示,肿瘤直径<2cm、2~3cm和>3cm的胆管癌患者CA19-9水平分别为34.00 (12.00) μg/L、367.00 (60.00) μg/L和828.00 (222.00) μg/L。Kruskal-Wallis H检验结果显示,三种不同肿瘤直径的胆管癌患者的CA19-9水平不全相同(H=25.748,P<0.001)。两两比较结果显示,三种不同肿瘤直径(<2cm、2~3cm和>3cm)的胆管癌患者CA19-9水平均不相同。

五、知识小贴士

  • 两独立样本资料的非参数检验,既可以采用Wilcoxon秩和检验,也可以采用Kruskal-Wallis H检验,两者检验结论一致。
  • 对于参数检验,两两比较的方法有Tukey法、Scheffe法、Bonferroni法、Dunnett法等。而对于非参数检验,如Kruskal-Wallis H检验,两两比较通常可采用DSCF(Dwass-Steel-Critchlow-Fligner)法,但在SPSS软件中默认使用的是Bonferroni法。
  • 对于多组定量资料比较,在符合正态性和方差齐性的条件下,首选使用单因素方差分析。对于不是特别严重的方差不齐,可使用单因素方差分析的校正检验方法(Welch one-way ANOVA/ Welch’s F检验);但当组间方差差异较大时,建议使用非参数检验(Kruskal-Wallis H检验)。如果数据正态性和方差齐性都不满足,最好使用非参数检验(Kruskal-Wallis H检验)。
End
文章目录 沉浸式阅读