关键词:SPSS; 非参数检验; 秩和检验; 配对样本Wilcoxon符号秩检验; 配对秩和检验
一、案例介绍
对12份血清分别用原方法(检测时间15分钟)和新方法(检测时间10分钟)测谷草转氨酶,问两种方法所得结果是否有差别?
创建数值型变量“Old”和 “New”,测量尺度设为“标度”,分别表示用原方法和新方法测得的谷草转氨酶含量。部分数据见图1。案例可从“附件下载”处下载。
二、问题分析
本案例的分析目的是比较对同一组样品使用两种方法检测的结果是否有差异,即判断用新法与原法检测血清谷草转氨酶含量是否存在差异,属于配对设计定量资料比较的范畴。对于配对设计的连续性变量比较,可以选用配对t检验或Wilcoxon符号秩检验。配对t检验适用于两组差值近似服从正态分布的数据。当不满足该条件时,可选择Wilcoxon符号秩检验。首先,对新法与原法检测血清谷草转氨酶含量的差值进行正态性检验,若发现差值不服从正态分布,则应选用配对样本Wilcoxon符号秩检验。使用Wilcoxon 符号秩检验时,需要满足3个条件:
条件1:观察变量是连续变量或有序分类变量。本研究中的谷草转氨酶水平为连续变量,该条件满足。
条件2:观察变量可分为2组。本研究中分为原法和新法,该条件满足。
条件3:观察变量的数据结构为配对形式。本研究中数据属于同一组样品自身配对的形式,该条件满足。
三、软件操作及结果解读
(一) 适用条件判断(正态性检验)
1. 软件操作
配对样本Wilcoxon符号秩检验时,需要考察配对组别观测变量差值的正态性情况。所以正态性检验前先计算配对组别观测变量的差值。步骤如下:
① 在主界面点击“转换”—“计算变量”(图2)。
② 出现“计算变量”对话框,在该对话框左侧的“目标变量”录入框中输入新创建变量的名称,此处命名为“Change”。将变量“New”选入右侧“数字表达式”录入框中,然后点击下方的减号“-”,再将变量“Old”选入“数字表达式”录入框中,点击“确定”(图3)。
③ 在“数据视图”和“变量视图”中均可看到新生成的变量“Change”,“数据视图”中新变量显示在已有变量的最右侧,如图4所示。
接下来对表示两组差值的变量“Change”进行正态性检验,步骤如下:
④ 选择“分析”—“描述统计”—“探索”(图5)。
⑤ 在“探索”对话框中将新生成的变量“Change”选入右侧“因变量列表”框(图6)。
⑥ 在“图”子对话框中勾选“含检验的正态图”,取消勾选“茎叶图”,其他不变,如图7所示,点击“继续”,回到“探索”对话框,点击“确定”。
2. 结果解读
图8是对新生成变量“Change”的统计描述,其中列出了观察变量的“平均值”、“中位数”、“方差”、“标准偏差”、“最小值”和“最大值”等。可知两种方法的差值均数为9.50 nmol/SL,中位数为8.00 nmol/SL。
图9显示了两种正态性检验的结果,柯尔莫哥洛夫-斯米诺夫,K-S检验和夏皮罗-威尔克正态性,S-W检验。K-S检验适用于大样本资料,本案查看S-W检验结果,结果显示P=0.063<0.1,提示数据不服从正态分布;图10的Q-Q图上散点与对角线的分布重合度较低,也可以认为数据不服从正态分布。所以本案例宜选用配对样本Wilcoxon符号秩检验。关于正态性检验的注意事项详见推文(医学统计学核心概念及重要假设检验的软件实现(2/4)——正态性假设检验的SPSS实现)。
(二) 统计描述及推断
1. 软件操作
① 选择“分析”—“非参数检验”—“旧对话框”—“2个相关样本” (图11)。
② 在“双关联样本检验”对话框中将观察变量“Old”和“New”分别选入右侧“变量1”和“变量2”处(图12)。
③ 在“双关联样本检验”对话框中点击右侧“选项”,在该子对话框中勾选“描述”和“四分位数”,然后点击“继续”(图13),回到“双关联样本检验”对话框后点击“确定”。
2. 结果解读
(1) 统计描述
图14“描述统计”是两组变量的统计描述结果,可见使用原方法和新方法的两组“个案数”均为12,新方法测得的血清谷草转氨酶含量 “中位数”为171.00 nmol/SL,“第25个百分位数”为77.50 nmol/SL,“第75个百分位数”为235.50 nmol/SL;原方法测得的血清谷草转氨酶含量 “中位数”为166.00 nmol/SL,“第25个百分位数”为65.00 nmol/SL,“第75个百分位数”为214.50 nmol/SL。从均值看两组治疗前后可能存在差异,但还需要依据统计学检验的结果进行判断。
图15“秩”是对新变量“Change”的秩的描述,“负秩”值为2,表示有两份血清通过新法检测的值小于原法;“正秩”值为10,表示有十份血清通过新法检测的值大于原法。“绑定值”表示新法和原法检测值一样的样本数,在此处为0。
(2) 统计学推断
图16是配对样本Wilcoxon符号秩检验的结果,基于负秩计算得到的统计量Z =-2.043, P= 0.041<0.05,说明两组数据中位数差值与0的差异具有统计学意义,即通过原法和新法检测的血清谷草转氨酶含量的中位数不同,可以认为两种方法检测的结果不同。
四、结论
本研究欲比较新法与原法检测血清谷草转氨酶含量是否存在差异,对新法与原法检测数值的差值进行正态性检验发现差值不符合正态分布,故选用配对样本Wilcoxon符号秩检验进行分析。
结果显示,原法检测血清谷草转氨酶的含量为166.00 (P25~P75:65.00~214.50) nmol/SL;新法检测血清谷草转氨酶的含量为171.00 (P25~ P75:77.50~235.50) nmol/SL,两种方法检测结果差值的中位数为8.00 (13.75) nmol/SL,差异有统计学意义(Z =-2.043, P= 0.041),可以认为两种方法检测的结果不同。
五、知识小贴士
- 两组配对设计在临床研究中经常使用,针对连续性变量,主要有配对样本t检验和配对样本Wilcoxon符号秩检验两种分析方法。配对样本t检验的限制条件较多(详见配对样本t检验(Paired Samples t-test)——SPSS软件实现),但统计学效能更高;Wilcoxon符号秩检验的限制条件较少,但统计效能相较于配对样本t检验低。对于定量资料,若不满足正态性和方差齐性条件,这时小样本资料应选择秩转换的非参数检验更为恰当。
- 尽管通常认为参数检验的统计学效能优于非参数检验,但这指的是在满足参数检验的适用条件前提下,当不满足参数检验的适用条件时强行使用参数检验会降低其统计学效能,甚至会得出错误的结果。
六、分析小技巧
- 本案例中使用两组数值差值开展单样本Wilcoxon符号秩检验(单样本Wilcoxon符号秩检验(One Sample Wilcoxon Signed Rank Test) —SPSS软件实现),其结果与配对样本Wilcoxon符号秩检验结果完全一致。