关键词:Stata; 非参数检验; 秩和检验; 配对样本Wilcoxon符号秩检验; 配对秩和检验
一、案例介绍
对12份血清分别用原方法(检测时间15分钟)和新方法(检测时间10分钟)测谷草转氨酶,问两种方法所得结果是否有差别?数据见图1。本文案例可从“附件下载”处下载。
二、问题分析
本案例的分析目的是比较对同一组样品使用两种方法检测的结果是否有差异,即判断用新法与原法检测血清谷草转氨酶含量是否存在差异,属于配对设计定量资料比较的范畴。对于配对设计的连续性变量比较,可以选用配对t检验或Wilcoxon符号秩检验。配对t检验适用于两组差值近似服从正态分布的数据。当不满足该条件时,可选择Wilcoxon符号秩检验。首先,对新法与原法检测血清谷草转氨酶含量的差值进行正态性检验,若发现差值不符合正态分布,则应选用配对样本Wilcoxon符号秩检验。使用Wilcoxon 符号秩检验时,需要满足三个条件:
条件1:观察变量是连续变量或有序分类变量。本研究中的谷草转氨酶水平为连续变量,该条件满足。
条件2:观察变量可分为2组。本研究中分为原法和新法,该条件满足。
条件3:观察变量的数据结构为配对形式。本研究中数据属于同一组样品自身配对的形式,该条件满足。
三、软件操作及结果解读
(一) 适用条件判断(正态性检验)
1. 软件操作
本案例中需要判断新法与原法检测血清谷草转氨酶含量的差值是否服从正态(或近似正态)分布。
①*使用Shapiro-Wilk检验分别考察两组差值的正态性*
gen d=new-old swilk d
② *绘制两组差值的正态分位图*
qnorm d
2. 结果解读
图2中正态性检验结果显示P=0.069<0.1,提示数据不服从正态分布;图3两组差值的正态分位图上散点与对角线的分布重合度较低,也可以认为数据不服从正态分布。本案例宜选用配对样本Wilcoxon符号秩检验。
(二) 统计描述及推断
1. 统计描述
(1) 软件操作
*描述性分析*
tabstat new old d, stat(count mean sd var q)
(2) 结果解读
图4“Tabstat(统计描述)”提供了研究案例的“N(样本量)”、“mean(平均值)”、“Sd (标准差)”和“Variance (方差)”、“p25(第25百分位数)”、“p50(中位数)”和“p75(第75百分位数)”。可知,用原法检测血清谷草转氨酶的含量为166 (P25~P75:70~209) nmol/SL;用新法检测血清谷草转氨酶的含量为171 (P25~ P75:79~231) nmol/SL;两种方法检测结果差值为8 (P25~ P75:2~15.5) nmol/SL。
2. 统计推断
(1) 软件操作
①*配对样本t检验*
ttest new == old
②*配对样本Wilcoxon符号秩检验*
signrank new=old
(2) 结果解读
图6分析的“Statistic (统计量)”、“df (自由度)”、“P值”、“Mean difference (均数差)” 及其“95% Confidence Interval (95%可信区间,95%CI)”、“SE difference (均数差标准误)”及其95%CI。由Wilcoxon符号秩检验结果可知,Z = 2.043,P= 0.0411,提示差异有统计学意义(P<0.05),可以认为两种方法检测的结果不同。
如果本案例采用“Student’s t (学生t检验)”结果(即配对样本t检验)如图5所示,t = 1.388,P=0.193,则会得出两种方法检测的结果差异无统计学意义的结论,与Wilcoxon秩检验结果完全相反。
四、结论
本研究欲比较新法与原法检测血清谷草转氨酶含量是否存在差异,对新法与原法检测数值的差值进行正态性检验发现差值不符合正态分布,故选用配对样本Wilcoxon秩检验进行分析。
结果显示,用原法检测血清谷草转氨酶的含量为166 (P25~P75:70~209) nmol/SL;用新法检测血清谷草转氨酶的含量为171 (P25~ P75:79~231) nmol/SL;两种方法检测结果差值为8 (P25~ P75:2~15.5) nmol/SL,Z = 2.043, P= 0.0411,提示差异有统计学意义(P<0.05),可以认为两种方法检测的结果不同。