独立样本Wilcoxon秩和检验:Mann-Whitney U检验(Mann-Whitney U Test)——Stata软件实现

发布于 2022年1月2日 星期日 16:26:23 浏览:13705
原创不易,转载请注明来源,感谢!
附件下载:
独立样本Wilcoxon秩和检验.zip 请勿重复点击,如无响应请耐心等待或稍后再试。

在前面文章中介绍了独立样本Wilcoxon秩和检验(Wilcoxon rank sum test)的假设检验理论 ,本篇文章将实例演示在Stata软件中实现Wilcoxon秩和检验:Mann-Whitney U检验(Mann-Whitney U Test)的操作步骤。

关键词:Stata; 非参数检验; 秩和检验; Wilcoxon秩和检验; 独立样本秩和检验; Mann-Whitney U检验

一、案例介绍

某医师对12例高血压患者和11例糖尿病患者血清总胆固醇(TCHO)含量(mmol/L)进行了测定,问高血压患者和糖尿病患者的血清总胆固醇含量是否不同?部分数据见图1。本文案例可从“附件下载”处下载。

图1

二、问题分析

本案例的分析目的是比较两组计量资料是否有差异,即判断高血压患者和糖尿病患者的血清总胆固醇含量是否不同。比较两组计量资料是否有差异可以使用两独立样本t检验或Mann-Whitney U检验。如果数据满足正态性和方差齐性要求则可以使用两独立样本t检验。若满足正态性,不满足方差齐性,可使用校正t检验(Welch’s t检验)。但如果数据的方差相差太大,最好使用非参数检验(Mann-Whitney U检验)。如果数据正态性和方差齐性都不满足,最好使用非参数检验(Mann-Whitney U检验)。Mann-Whitney U检验,需要满足3个条件:

条件1:有一个观察变量,且观察变量为连续变量(不满足正态分布或方差严重不齐)或等级变量。该条件需要通过软件判断或专业判断。

条件2:有一个分组变量,且为二分类。本研究中分为高血压患者组和糖尿病组,该条件满足。

条件3:具有相互独立的观测值。本研究中各研究对象的TCHO含量都是独立的,不存在互相干扰的情况,该条件满足。

三、软件操作及结果解读

(一) 适用条件判断

1. 条件1判断(正态性检验)

(1) 软件操作

①*使用Shapiro-Wilk检验分别考察每组的正态性*

swilk TCHO if group==1

图2

swilk TCHO if group==2

图3

②*分别绘制每组的正态分位图*

qnorm TCHO if group==1

图4

qnorm TCHO if group==2

图5
(2) 结果解读

图2、图3的正态性检验结果显示两组的P值为0.036和0.037,均<0.1,提示两组数据不服从正态分布;图4、图5的Q-Q图上两组散点偏离对角线较远,也提示两组数据不服从正态分布。关于正态性检验的注意事项详见文章(医学统计学核心概念及重要假设检验的软件实现(2/4)——正态性假设检验的SPSS实现

2. 条件1判断(方差齐性检验)

(1) 软件操作

*描述性分析*

tabstat TCHO if group==1, stat(count mean sd var q)

图6

tabstat TCHO if group==2, stat(count mean sd var q)

图7

*方差齐性检验*

robvar TCHO, by(group)

图8
(2) 结果解读

由图6、图7“tabstat (描述性分析)”中“Sd (标准差)”和“Variance (方差)”结果可知,高血压组和糖尿病组的标准差分别为1.481和0.980,方差分别为2.194和0.960,两组之间标准差和方差数值貌似存在差异,但还需要依据统计学检验的结果进行判断。

图8中W0是levene方差齐性检验结果,可见F=5.589,P=0.028<0.1,提示两组数据方差不齐。关于方差齐性检验的更多内容请阅读(医学统计学核心概念及重要假设检验的软件实现(4/4)——方差齐性检验及SPSS实现)。

综上,本案例中两组连续变量数据既不服从正态分布,也不满足方差齐性,可以考虑使用Mann-Whitney U检验。

(二) 统计描述及推断

1. 软件操作

*Mann-Whitney U检验*

ranksum TCHO, by(group)

图9

2. 结果解读

(1) 统计描述

图6、图7“tabstat (统计描述)”提供了两组数据的“N(样本量)”、“Mean(均数)”、“sd(方差)”、“variance(标准差)”、“p25(第1四分位数)”、“p50(中位数)”和“p75(第3四分位数)”。可知,高血压患者的TCHO含量为6.06 (P25~P75:3.74~6.61) mmol/L,糖尿病患者的TCHO含量为5.04 (P25~P75:4.77~5.55) mmol/L。两组的TCHO值貌似存在差异,但还需要依据统计学检验的结果进行判断。

(2) 统计学推断

图9“Two-sample wilcoxon rank-sum (Mann-Whitney)-Test (两样本符号秩和检验)”分析结果,可知两组人群TCHO含量差异无统计学意义,Z=0.154,P=0.8777>0.05,尚不能认为高血压患者和糖尿病患者的血清总胆固醇含量不同。

四、结论

本研究采用Mann-Whitney U检验判断高血压患者和糖尿病患者的血清总胆固醇含量是否不同。通过正态分位图和Shapiro-Wilk检验,提示两组数据不服从正态分布;通过Levene’s检验,提示两组数据总体方差不齐,符合使用Mann-Whitney U检验的条件。

结果显示,高血压患者和糖尿病患者的TCHO含量分别为6.060 (P25~P75:3.74~6.61) mmol/L和5.04 (P25~P75:4.77~5.55) mmol/L。Mann-Whitney U检验结果显示,两组人群TCHO含量差异无统计学意义(Z=0.154,P=0.8777)。

End
文章目录 沉浸式阅读