关键词:jamovi; 非参数检验; 秩和检验; Wilcoxon秩和检验; 独立样本秩和检验; Mann-Whitney U检验
一、案例介绍
某医师对12例高血压患者和11例糖尿病患者血清总胆固醇含量(mmol/L)进行了测定,问高血压患者和糖尿病患者的血清总胆固醇含量是否不同?对数据的变量进行标签赋值后部分数据见图1。本文案例可从“附件下载”处下载。
二、问题分析
本案例的分析目的是比较两组计量资料是否有差异,即判断高血压患者和糖尿病患者的血清总胆固醇含量是否不同。针对这种情况可以使用Mann-Whitney U检验。但需要满足三个条件:
条件1:有一个观察变量,且观察变量为连续变量(不满足正态分布或方差严重不齐)或等级变量。该条件需要通过软件判断或专业判断。
条件2:有一个分组变量,且为二分类。本研究中分为高血压患组和糖尿病组,该条件满足。
条件3:具有相互独立的观测值。本研究中各研究对象的血清总胆固醇含量都是独立的,不存在互相干扰的情况,该条件满足。
三、软件操作及结果解读
(一) 适用条件判断
1. 条件1判断(正态性检验)
(1) 软件操作
Mann-Whitney U检验时,需要分别考察每一组数据的正态性情况,因此需要使用拆分功能。
① 选择“分析”—“探索”—“描述”,将观察变量“血清总胆固醇”选入右侧“变量”框,将“分组”选入右侧“拆分”(图2)。
② 在“绘图”中勾选“Q-Q图”(图3),结果如图4所示。
③ 在“统计”中勾选“Shapiro-Wilk检验”(图5),结果如表1所示。
(2) 结果解读
图4和表1按照组别列出了两组的分析结果。图4的Q-Q图上两组散点偏离对角线较远,提示两组数据不满足正态分布;表1的正态性检验结果显示两组的P值为0.034和0.036,均<0.1,也提示两组数据不满足正态分布。
2. 条件1判断(方差齐性检验)
(1) 软件操作
① 选择“分析”—“探索”—“描述”,在“离散趋势”中勾选“标准差”和“方差”(图6),结果如表2所示。
② 选择“分析”—“ T检验”—“独立样本T检验”,将“血清总胆固醇”选入右侧“因变量”框,将“分组”选入右侧“分组变量”框(图7)。
③ 在“适用条件判断”中勾选“方差齐性检验”,结果如表3所示。
(2) 结果解读
由表2“描述性分析”表格中“标准差”和“方差”结果可知,高血压组和糖尿病组的标准差分别为1.481和0.980,方差分别为2.194和0.960,两组之间标准差和方差数值存在差异,但还需要依据统计学检验的结果进行判断。
表3“方差齐性检验(Levene’s)”为方差齐性检验结果,可见F=5.589,P=0.028<0.1,提示两组数据方差不齐。
综上,本案例中两组连续变量数据既不服从正态分布,也不满足方差齐性,可以考虑使用Mann-Whitney U检验。
(二) 统计描述及推断
1. 软件操作
选择“分析”—“T检验”—“独立样本T检验”,按照图8勾选相应选项,结果如表4所示。
2. 结果解读
(1) 统计描述
表1“描述”提供了两组数据的“个案数”、“中位数”、“25百分位数”和“75百分位数”。可知,高血压患者的血清总胆固醇含量为6.060 (P25~P75:3.790~6.540) mmol/L,糖尿病患者的血清总胆固醇含量为5.040 (P25~P75:4.825~5.430) mmol/L。两组的血清总胆固醇值存在差异,但还需要依据统计学检验的结果进行判断。
(2) 统计学推断
表4“独立样本T检验”表格中提供了“Student’s t”、“Welch’s t”和“Mann-Whitney U”检验三种方法分析的“统计量”、“自由度”、“P值”、“均数差”及其“95%置信区间”、“均数差标准误”、“效应量” 及其95%置信区间。
本案例采用Mann-Whitney U检验的分析结果,可知高血压患者和糖尿病患者的血清总胆固醇均值相差0.238 mmol/L,95%CI为-1.460~1.240;U=63.500,P=0.902>0.05,尚不能认为高血压患者和糖尿病患者的血清总胆固醇含量不同。“秩二列相关系数”为0.038,为极弱相关。此外,本案例中学生t检验和校正t检验分析结果与Mann-Whitney U检验结果一致,进一步验证两组人群之间的血清总胆固醇含量不同。
四、结论
本研究采用Mann-Whitney U检验判断高血压患者和糖尿病患者的血清总胆固醇含量是否不同。通过Q-Q图和Shapiro-Wilk检验,提示两组数据不服从正态分布;通过Levene’s检验,提示两组数据总体方差不齐,符合使用Mann-Whitney U检验的条件。
结果显示,高血压患者和糖尿病患者的血清总胆固醇含量分别为6.060 (P25~P75:3.790~6.540) mmol/L和5.040 (P25~P75:4.825~5.430) mmol/L,均值相差0.238 (95%CI:-1.460~1.240) mmol/L。Mann-Whitney U检验结果显示,两组人群血清总胆固醇含量差异无统计学意义(U=63.500,P=0.902),“秩二列相关系数”为0.038,为极弱相关。因此,尚不能认为高血压患者和糖尿病患者的血清总胆固醇含量不同。
五、知识小贴士
- 比较两组计量资料是否有差异可以使用两独立样本t检验或Mann-Whitney U检验。如果数据满足正态性和方差齐性要求则可以使用两独立样本t检验。若满足正态性,不满足方差齐性,可使用校正t检验(Welch’s t检验)。但如果数据的方差相差太大,最好使用非参数检验(Mann-Whitney U检验)。如果数据正态性和方差齐性都不满足,最好使用非参数检验(Mann-Whitney U检验)。