关键词:SPSS; 单因素方差分析; F检验; Welch检验; 韦尔奇检验; 事后检验; 两两比较
一、案例介绍
某医生用A、B、C三种方案治疗血红蛋白低下的贫血患者,治疗两个月后,记录每名受试者血红蛋白的上升克数。问3种治疗方案对患者贫血的疗效是否有差别?
创建代表治疗方案的变量“group”,1、2、3 三种数字代表治疗方案“A”、“B”、“C”;创建代表血红蛋白上升克数的变量“Hb”,测量尺度设为“标度”。部分数据见图1。本文案例可从“附件下载”处下载。
二、问题分析
本案例的分析目的是比较3种治疗方案对患者贫血的疗效是否有差别,即判断3种治疗方案患者的血红蛋白上升克数是否存在差异。针对这种情况可以使用单因素方差分析。但需要满足6个条件:
条件1:观察变量为连续变量。本研究中的血红蛋白上升克数为连续变量,该条件满足。
条件2:观测值相互独立。本研究中各研究对象的观测值都是独立的,不存在互相干扰的情况,该条件满足。
条件3:观测值可分为多组(≥2)。本研究中分为A、B、C三组,该条件满足。
条件4:观察变量不存在显著的异常值,该条件需要通过软件分析后判断。
条件5:各组观测值为正态(或近似正态)分布,该条件需要通过软件分析后判断。
条件6:多组观测值的整体方差相等,该条件需要通过软件分析后判断。
三、软件操作及结果解读
(一) 适用条件判断
1. 条件5判断(正态性检验)
(1) 软件操作
①选择“分析”—“描述统计”—“探索”(图2)。
②在“探索”对话框中将观察变量“Hb”选入右侧“因变量列表”框、将分组变量“group”选入右侧“因子列表”框(图3)。
③点击右侧“图”,在子对话框中勾选“含检验的正态图”,取消勾选“茎叶图”,其他不变,如图4所示,点击“继续”,回到“探索”对话框,点击“确定”,即可得到正态性检验结果。
(2) 结果解读
图5是对三组数据的“描述”结果,包括“A”、“B”、“C”三组的“平均值”、“平均值的95%置信区间”、“中位数”、“标准偏差”、“四分位距”等指标。
图6显示了两种正态性检验的结果,柯尔莫哥洛夫-斯米诺夫,K-S检验和夏皮罗-威尔克正态性,S-W检验。K-S检验适用于大样本资料,本案查看S-W检验结果,三组P值分别为0.296、0.486和0.435,三组的P值均>0.1,提示三组数据服从正态分布。
图7-1—图7-3为三组数据的Q-Q图,图上三组散点基本围绕对角线分布,提示三组数据呈正态分布。
综上,本案例满足条件5。
2. 条件4(异常值判断)
(1) 软件操作
通过以上正态性检验操作步骤已得到异常值判断结果。
(2) 结果解读
图8是三组治疗方案的血红蛋白的箱图,图中未显示存在异常值。结合图5表格中所列出的各组观察变量的最小值和最大值,依据专业可判断血红蛋白的上升克数均可能存在0.1 g和3.7 g的情况。因此,本案例未发现需要删除的异常值,满足条件4。
3. 条件6判断(方差齐性检验)
由图5“描述”中“标准偏差”和“方差”结果可知,A、B、C三组的标准差分别为 0.87、0.74、0.54 g,方差分别为0.75、0.55和0.29,三组的方差数值存在差异,但还需要依据统计学检验的结果进行判断。
(1) 软件操作
①选择“分析”—“比较平均值”—“单因素ANOVA检验”(图9)。
②在“单因素ANOVA检验”对话框中将观察变量“Hb”选入右侧“因变量列表”框、将分组变量“group”选入右侧“因子”框(图10)。
③单击“选项”按钮,在弹出的对话框中选中“描述”、“方差齐性检验”和“平均值图”复选框,其他不变,如图11所示,点击“继续”,回到“单因素ANOVA检验”对话框,点击“确定”按钮。
(2) 结果解读
图12显示“方差齐性检验”为方差齐性检验结果,可见基于平均值的F=2.610,P=0.080<0.1,提示三组数据方差不齐,不满足条件6。
(二) 统计描述及推断
1. 软件操作
①选择“分析”—“比较平均值”—“单因素ANOVA检验”(图9),
②单击“选项”按钮,按照图13勾选相应选项。
2. 结果解读
(1) 统计描述
由图5可知,A、B、C三组血红蛋白的上升克数分别为1.69±0.87、1.25±0.74和1.02±0.54 g。三组数值存在差异,但还需要依据统计学检验的结果进行判断。
(2) 统计学推断
图14和图15为“单因素方差分析”结果,提供了单因素方差分析(Fisher’s)和校正单因素方差分析(韦尔奇)两种方法分析的结果。本案例满足条件1-5,不满足方差齐性,但方差并非严重不齐,所以采用校正单因素方差分析(韦尔奇)法的结果,F=5.477,P=0.007;提示各组均数不全相等(至少有两组均数不相同)。
图16为“单因素方差分析”中提供的平均值图,给出的是各组间样本均数的折线图,可以更直观地展现各组样本的大小关系及其与相应的分组变量间的关系。
(三) 事后检验(两两比较)
通过上述分析得出了“各组均数不全相等”的结论,但具体是哪些组别之间存在差异尚不清楚,因此需要进行事后检验,开展两两比较。
1. 软件操作
操作步骤同上述整体检验的软件操作步骤:
①选择“分析”—“比较平均值”—“单因素ANOVA检验”(图9);
②单击“事后比较”按钮,按照图17勾选相应选项,因为本案例不满足方差齐性,所以选择“盖姆斯-豪厄尔”法。
2. 结果解读
图18“显著性”一栏,凡是显著性P<0.05,表示两者之间差异有统计学意义。由图中可知,A组和B组之间的差异为0.438 g,但差异无统计学意义(P=0.132);A组和C组之间的差异为0.665 g,差异有统计学意义(P=0.005);B组和C组之间的差异为0.227 g,差异无统计学意义(P=0.421)。因此,可知A组血红蛋白的上升克数比C组高0.665 g,差异有统计学意义。
四、结论
本研究采用单因素方差分析判断3种方案治疗患者贫血的血红蛋白上升克数是否存在差异。通过专业知识判断,三组数据不存在需要删除的异常值;通过绘制Q-Q图和正态性检验,提示三组数据服从正态分布;通过Levene’s检验,提示三组数据间方差不齐,采用校正单因素方差分析(韦尔奇)法分析数据。
分析结果显示,A、B、C三组血红蛋白的上升克数分别为1.68±0.87、1.25±0.74和1.02±0.54 g,三组均数不全相等(F=5.477,P=0.007)。进一步采用盖姆斯-豪厄尔法进行两两比较,显示A组血红蛋白的上升克数比C组高0.665 g,差异有统计学意义(P=0.005);A组血红蛋白的上升克数比B组高0.438 g,但差异无统计学意义(P=0.132);B组血红蛋白的上升克数比C组高0.227 g,但差异无统计学意义(P=0.421)。因此,A、B、C三种治疗方案对治疗贫血患者疗效不一样,A方案疗效最好。
五、分析小技巧
(一) 正态性检验
- 严格来讲,单因素方差分析时,需要分别对每一组数据的正态性进行检验。但方差分析对数据的分布具有一定的耐受力,如果数据不是严重偏态或者只有部分组别数据不满足正态性要求,鉴于参数检验的统计学效能优于非参数检验的角度,还是可以使用单因素方差分析方法,而不使用非参数检验。
- 单因素方差分析时,也可考察整体数据的正态性情况。如上所述,单因素方差分析对数据分布具有一定的耐受力,如果数据满足整体正态分布,也是可以使用该种分析方法。但我们建议尽可能分组别检验数据的正态性。关于正态性检验的注意事项详见文章(医学统计学核心概念及重要假设检验的软件实现(2/4)——正态性假设检验的SPSS实现)。
(二) 方差齐性检验
- 对于不是特别严重的方差不齐,单因素方差分析提供了校正检验方法(Welch’s),是考虑了方差差异之后的更为稳健的分析结果。但当组间方差差异较大时,校正结果也不一定可信,建议使用非参数检验(Kruskal-Wallis H检验)。如果数据正态性和方差齐性都不满足,最好使用非参数检验(Kruskal-Wallis H检验)。关于方差齐性检验的更多内容请阅读(医学统计学核心概念及重要假设检验的软件实现(4/4)——方差齐性检验及SPSS实现)。
(三) 事后检验(两两比较)
- 多重比较一般分为事前检验(Prior tests)和事后检验(Post hoc tests)。事前检验是指在数据收集之前便决定了要通过多重比较来考察多个组与某个特定组之间的差别,多根据专业意义设定比较的策略。如果是事前检验,不论整体分析的结果如何,均可进行比较,并且一般不需要对检验水准进行太多修正。事后检验只有在方差分析得到有统计学意义的F值后才有必要进行,是一种探索性分析。对于事先未计划的多重比较(即事后检验),各组间的差别只是一种提示,要确认这种差别最好重新设计实验。
- SPSS在单因素方差分析中,提供了14种用于组间方差齐时两两比较的方法,提供了4种方差不齐时的比较方法,共计18种方法。但在方差不齐时最好不要采用方差分析甚至两两比较,此时可以进行变量转换或采用非参数检验。
- 事前检验(Prior tests)最常用的两两比较方法有:LSD法和Dunnett-t检验。事后检验(Post hoc tests)最常用的方法有:SNK法、Duncan法、Turkey’b和Scheffe法。
- LSD法是最灵敏的方法,因此也容易犯假阳性错误。Dunnett-t法多用于多个实验组与一个对照组比较,此时应指定对照组,多用于确证性研究,少用于探索性研究。Bonferroni法是对LSD法的严格校正,结果更加保守,但当组数较多时,较难发现组间差异,因此如果各组例数相差不大且组数不多时可采用。