关键词:SPSS; 重复测量; 重复测量资料; 重复测量方差分析; 两因素重复测量方差分析; 球形检验; 交互作用; 主效应; 单独效应
一、案例介绍
研究A、B两种饲料对家兔的增重效果,选择20只家兔,随机分成两组,第一组用饲料A饲养,第二组用饲料B饲养,并于试验开始后第一个月(time1)、第二个月(time2)、第三个月(time3)分别测量2组家兔体重(kg),试比较A、B两种饲料对家兔的增重效果有无差别?
创建代表分组情况的变量“group”,测量尺度均设为“名义”,赋值为“1”和“2”分别代表用饲料A饲养和用饲料B饲养;创建观察变量“time1”、“time2”和“time3”,测量尺度设为“标度”,分别记录在试验开始后第一个月、第二个月和第3个月时2组家兔的体重。对数据的变量和水平进行标签赋值后部分数据见图1。本文案例可从“附件下载”处下载。
二、问题分析
本案例的分析目的是比较A、B两种饲料对家兔的增重效果有无差别。由于3个时间点的数据属于重复测量数据,且有两个组别,可以使用两因素(时间因素time和分组因素group)重复测量方差分析。但需要满足以下6个条件:
条件1:观察变量唯一,且为连续变量。本研究中观察变量只有体重,且为连续变量,该条件满足。
条件2:有两个分析因素。本研究有时间因素time和分组因素group两个因素,该条件满足。
条件3:观察变量为重复测量数据,即不满足独立性。本研究中两个组别在3个时间点时测量的体重均是针对同一批样本,因此不满足独立性,该条件满足。
条件4:观察变量不存在显著的异常值,该条件需要通过软件分析后判断。
条件5:各组、各水平(时间点)观察变量为正态(或近似正态)分布,该条件需要通过软件分析后判断。
条件6:相互比较的各处理水平(组别)的总体方差齐,该条件需要通过软件分析后判断。
三、软件操作及结果解读
(一) 适用条件判断1
1. 条件4判断(异常值判断)
(1) 软件操作
①选择“分析”—“描述统计”—“探索”(图2)。
②在“探索 ”对话框中将观察变量“time1”、“time2”和“time3”选入右侧“因变量列表”框,将分组变量“group”选入右侧“因子列表”框,点击“确定”(图3)。
(2) 结果解读
异常值通过箱线图和专业知识进行判断,图4-1—图4-3为三个时间点时两组的箱线图,图4-3提示存在两个异常值。查看数据表可以发现在time3的第14、15位数值分别为4.8 kg和4.9 kg,依据专业可判定该值可以保留。综上,本案例未发现需要处理的异常值,满足条件3。
2. 条件5判断(正态性检验)
(1) 软件操作
① 选择“分析”—“描述统计”—“探索”(图2)。
② 在“探索”对话框中将观察变量“time1”、“time2”和“time3”选入右侧“因变量列表”框,将分组变量“group”选入右侧“因子列表”框,点击“确定”(图3)。
(步骤①②同条件4判断的软件操作,故条件4和条件5判断可同时在“探索”对话框中进行)。
③ 在“图”子对话框中勾选“含检验的正态图 ”,取消勾选“茎叶图”,其他不变,点击“继续”(图5),回到“探索”对话框后点击“确定”,则会输出结果。
(2) 结果解读
图6显示了两种正态性检验的结果,Kolmogorov-Smirnov (柯尔莫哥洛夫-斯米诺夫,K-S)检验和Shapiro-Wilk (夏皮罗-威尔克,S-W)检验。K-S检验适用于大样本资料,本案查看S-W检验结果,可见各组P值均>0.1,提示所有时间点下两组的数据均服从正态分布。图7为在time1时两组正态性检验的Q-Q图,可见散点基本围绕对角线分布,提示数据服从正态分布。其他时间点时两组的Q-Q图(未展示)也显示散点基本围绕对角线分布,提示数据服从正态分布。综上,本案例满足条件5。关于正态性检验的注意事项详见推文(医学统计学核心概念及重要假设检验的软件实现(2/4)——正态性假设检验的SPSS实现)。
3. 条件6判断(方差齐性检验)
方差齐性检验详见后文。
(二) 软件实现步骤
进行方差齐性检验、球形假设检验以及两因素重复测量方差分析时都需要基于重复测量窗口,以下首先介绍调用重复测量窗口的操作步骤。
1. 调用“重复测量窗口”
①选择“分析”—“一般线性模型”—“重复测量” (图8)。
②出现“重复测量定义因子”对话框,“主体内因子名”处要录入重复测量的因子名称,自定义名称。由于本案例是在3个时间点重复测量,所以此处将“因子”改为“time”,下方“水平数”是填入测量次数,则填入“3”,如图9-1所示,然后点击“添加”,如图9-2所示。最后点击“定义。
③出现“重复测量”对话框,将左侧三个变量“time1”、“time2”和“time3”选入右侧“主体内变量”中,将左侧变量“group”选入右侧“主体间因子”中,则如图10所示。此后的软件操作都基于该窗口。
2. “重复测量窗口”设置
①在“重复测量”对话框中点击右侧“模型”,保持默认,即全因子模型,因为需要分析交互作用(图11)。
②在“重复测量”对话框中点击右侧“图”,出现“轮廓图”子对话框,将“time”选入右侧“水平轴”中,将“group”选入右侧“单独的线条”中,然后点击“添加”,保持选中“折线图”,如图12所示,点击“继续”回到主对话框。
③在“重复测量”对话框中点击右侧“EM 平均值”,出现“重复测量:估算边际均值”子对话框,将“time”、“group”和“group*time”选入右侧“显示下列各项的均值”列表框中,勾选“比较主效应”,下方“置信区间调整”选则“邦弗罗尼”,如图13所示,点击“继续”回到主对话框。
④在“重复测量”对话框中点击右侧“选项”,出现子对话框,勾选“描述性分析”和“齐性检验”,如图14所示,点击“继续”回到主对话框,点击“确定”,则输出一系列结果。
(三) 适用条件判断2(方差齐性检验)
图15“误差方差的莱文等同性检验 (Levene’s方差齐性检验)”主要查看每个时间点的第一行“基于平均值”的结果,三个时间下方差齐性检验结果分别为F=1.393、P=0.253,F=1.939、P=0.181,F=0.952、P=0.342;提示每个时间点的两组之间都满足方差齐性。本案例满足条件6。关于方差齐性检验的更多内容请阅读(医学统计学核心概念及重要假设检验的软件实现(4/4)——方差齐性检验及SPSS实现)。
(四) 球形假设检验
图16“莫奇来球形度检验”中给出了球形假设检验结果,W=0.886,P=0.356,大于0.05,满足球形假设,因此本案例可以直接采用非校正方法分析的结果。当违背了球形假设条件时,需要进行epsilon (ε)校正。此处提供了三种一元方差校正方法:格林豪斯-盖斯勒、辛-费德特和下线。一般建议采用前两种方法,当epsilon (ε)<0.75时,使用格林豪斯-盖斯勒法,当epsilon (ε)>0.75时,使用辛-费德特法。
(五) 统计描述与推断
1. 统计描述
图17列出了A、B两组time1、time2、time3时间点的均值分别为1.54±0.33 kg、3.91±0.91kg、5.60±0.89 kg和1.51±0.27 kg、2.73±0.56 kg、3.81±0.61 kg。
图18的估算边际均值图绘制了两组三个时间点体重的变化情况,可见两组的体重均有增加,并且增加的幅度基本保持一致。
图19提供了两组三个时间点的“估算边际平均值”、“标准误差”及均值的“95% Confidence Interval (95%CI)”。此处均值和图17的统计描述结果一致。
2. 交互作用判断
由于本案例有两个因素(一个为时间因素time,另一个为分组因素group),因此需要首先判断两个因素之间是否存在交互作用。如果交互作用有统计学意义,则需要分析单独效应。
图20为“主体内效应检验”,第一行为“假定球形度”结果,当满足球形性假设时查看该行统计推断结果。此处time与group之间的交互作用结果为Ftime*group=31.060,P<0.001,提示time与group之间存在交互作用。因此,本案例需要分析单独效应。
(六) 单独效应分析
1. 软件操作
①回到“重复测量”对话框,点击下方“粘贴”,则出现“IBM SPSS Statistics 语法编辑器”界面,编辑区中现有的语法是在“重复测量”对话框中已经通过菜单命令执行的操作(图21)。单独效应分析需要在第8行“/EMMEANS =TABLES(group*time)”后输入“COMPARE(group)ADJ(BONFERRONI)”,并复制该语句,将COMPARE后的“group”改为“time” (图22)。COMPARE(group)是指根据变量“group”提供单独效应结果;ADJ(BONFERRONI)是指对使用Bonferroni法进行各组的多重比较。若无需多重比较,可删去。
2. 结果解读
(1) group的单独效应
由图23“单变量检验”可知,time1时两组间的体重增量差异无统计学意义(F=0.049,P=0.827);time2时两组间的体重增量差异有统计学意义(F=12.298,P=0.003);time3时两组间的体重增量差异有统计学意义(F=27.493,P<0.001)。
(2) time的单独效应
检验time的单独效应是指在group的不同组中比较时间因素的差异。图24“多变量检验”给出了四种统计推断结果,其中“比莱轨迹”最为稳健,但4个统计量结论不一致时,推荐以它为最终结论。A组内不同时间点的体重增量差异有统计学意义(F=257.428,P<0.001);B组内不同时间点的体重增量差异也有统计学意义(F=83.258,P<0.001)。
(3) group的事后检验
上面分析得出了“time2和time3时,两组之间的体重增量差异均有统计学意义”的结论。但由于group只有两组,因此无须再进行事后检验。但由图25“group成对比较”结果可知,time1时,A组的体重增量与B组之间差异无统计学意义(P=0.827),time2时,A组的体重增量比B组高1.18 kg,差异有统计学意义(P=0.003),time3时,A组体重与B组之间的差异进一步加大,A组的体重增量比B组高1.79 kg,差异有统计学意义(P<0.001)。
(4) time的事后检验
上面分析得出了“A、B两组内不同时间点的体重增量差异有均有统计学意义”的结论。现通过“邦弗罗尼”法分别对A、B两组内三个时间点数据进行两两比较,结果如图26“成对比较”,A组内,相比time1,time2和time3时的体重增量逐渐增加,且差异有统计学意义(P<0.001);B组内,相比time1,time2和time3时的体重增量逐渐增加,且差异也有统计学意义(P<0.001)。
四、结论
本研究采用两因素重复测量方差分析比较A、B两种饲料对家兔的增重效果有无差别。通过专业知识判断,数据不存在异常值;通过Shapiro-Wilk检验,提示各组数据服从正态分布;通过Levene’s检验,提示每个时间点的两组之间都满足方差齐性;球形度检验提示,满足球形假设(W=0.952,P=0.661);组别与time之间存在交互作用(Ftime*group=31.060,P<0.001),故进行单独效应分析。
A、B两组在试验开始后第1个月、第2个月和第3个月时的体重分别为1.54±0.33、3.91±0.91、5.60±0.89 kg和1.51±0.27、2.73±0.56、3.81±0.61 kg。时间的简单效应分析显示,A、B两组组内不同时间点的体重增量差异均有统计学意义(P<0.001)。通过“邦弗罗尼”法分别对A、B两组内三个时间点数据进行两两比较显示,A、B两组内不同时间点之间的体重增量差异均有统计学意义(P<0.001)。组别的单独效应和事后检验分析显示,time1时,A组的体重增量与B组之间差异无统计学意义(t=0.221,P=0.827),time2时,A组的体重增量比B组高1.18 kg,差异有统计学意义(t=3.507,P=0.003),time3时,A组体重与B组之间的差异进一步加大,A组的体重增量比B组高1.79 kg,差异有统计学意义(t=5.243,P<0.001)。综上,A饲料对家兔的增重效果更好。