关键词:MedCalc; 非参数检验; 秩和检验; Wilcoxon秩和检验; 独立样本秩和检验; Mann-Whitney U检验
一、案例介绍
某医生欲了解患者某生化指标(X,mmol/L)的水平和正常人是否有差异,随机抽取了136例患者和80例正常人进行生化指标的检测,试对数据进行分析(group为组别,其中1表示患者组,0表示正常组)。部分数据见图1。本案例数据可从“附件下载”处下载。
二、问题分析
本案例的分析目的是比较两组计量资料是否有差异,即判断患者组和正常组某生化指标X的含量是否存在差异。
比较两组计量资料是否有差异可以使用两独立样本t检验或Mann-Whitney U检验。若数据满足正态性和方差齐性,可使用两独立样本t检验;若满足正态性、不满足方差齐性,可使用校正t检验(Welch’s t检验);若数据的方差相差太大,最好使用非参数检验(Mann-Whitney U检验);若数据正态性和方差齐性都不满足,最好使用非参数检验(Mann-Whitney U检验)。
使用Mann-Whitney U检验,需要满足3个条件:
条件1:有一个观察变量,且观察变量为连续变量(不满足正态分布或方差严重不齐)或等级变量。该条件需要通过软件判断或专业判断。
条件2:有一个分组变量,且为二分类。本研究中分组变量为group,包括患者组和正常组两组,该条件满足。
条件3:具有相互独立的观测值。本研究中各研究对象的X含量都是独立的,不存在互相干扰的情况,该条件满足。
三、软件操作及结果解读
(一) 适用条件判断
1. 条件1判断(正态性检验)
(1) 软件操作
在“正态图”对话框(图3),“变量”选择“X”,“筛选条件”选择“group=0”,“选项”勾选“Q-Q图”,“检验正态分布”下选择“Shapiro-Wilk检验 (夏皮罗-威尔克正态性检验,S-W检验)”。
选择“统计”—“汇总统计”(图4),进入“汇总统计”对话框(图5),“变量”选择“X”,“筛选条件”选择“group=0”,“检验正态分布”下选择“Shapiro-Wilk检验 ”。
(2) 结果解读
图6为正常组(group=0)的Q-Q图,两组散点偏离对角线较远,提示该组数据不服从正态分布。图7中Shapiro-Wilk检验结果,W=0.9604,P=0.0006<0.05,,提示数据不服从正态分布。
参照上述操作可得到患者组的Q-Q图和Shapiro-Wilk检验结果(图8、图9),两组散点偏离对角线较远,W=0.9552,P=0.0069<0.1,提示数据不服从正态分布。关于正态性检验的更多内容请阅读(医学统计学核心概念及重要假设检验的软件实现(2/4) ——正态性假设检验的SPSS实现)。
2. 条件2判断(方差齐性检验)
(1) 软件操作
选择“统计”—“方差比检验 (F检验)”(图10),进入“方差比检验 (F检验)”对话框,采样1 “变量”选择“X”,“筛选条件”填“group=0”,表示正常组;采样2 “变量”选择“X”,“筛选条件”填“group=1”,表示患者组,见图11。
(2) 结果解读
图12为方差比检验 (F检验)的结果,可知F=1.9006,P=0.001,提示两组数据方差齐。关于方差齐性检验的更多内容请阅读(医学统计学核心概念及重要假设检验的软件实现(4/4)——方差齐性检验及SPSS实现)。
综上,本案例中两组连续变量数据不服从正态分布,组间也不满足方差齐性,可以考虑使用Mann-Whitney U检验。
(二) 统计描述及推断
1. 软件操作
选择“统计”—“等级和检验”—“Mann-Whitney检验(独立样本)” (图13),进入“Mann-Whitney检验”对话框(图14),采样1“变量”选择“X”,筛选条件填“group=0”,采样2“变量”选择“X”,筛选条件填“group=1”。
2. 结果解读
(1) 统计描述
图15为统计学描述结果。正常组X的中位数为778.5,95%CI为700.0~870.0;患者组X的中位数为1470.0,95%CI为1350.0~1642.4。
(2) 统计推断
图16为独立样本Wilcoxon符号秩检验结果。可知U=2080.00,P<0.0001,差异有统计学意义,可以认为正常组的X含量低于患者组。
四、结论
本研究欲比较正常组的生化指标X水平与患者组是否存在差异,对这两组的X含量进行正态性检验发现不服从正态分布,且两组方差不齐,故选用Mann-Whitney U检验进行数据分析。
经分析,正常组X的中位数为778.5,95%CI为700.0~870.0;患者组X的中位数为1470.0,95%CI为1350.0~1642.4。采用独立样本Wilcoxon符号秩检验(Mann-Whitney U检验)分析显示,检验统计量U =2080.00, P<0.0001,差异有统计学意义,提示患者组的X水平高于正常组。