关键词:SPSS; 重复测量; 重复测量资料; 重复测量方差分析; 两因素重复测量方差分析; 球形检验; 交互作用; 主效应; 单独效应; 协方差分析; 基线数据
一、案例介绍
研究A、B两种饲料对家兔的增重效果,选择20只家兔,随机分成两组,第一组用饲料A饲养,第二组用饲料B饲养,并于实验开始时(time0)、试验开始后第一个月(time1)、第二个月(time2)、第三个月(time3)分别测量2组家兔体重,试比较A、B两种饲料对家兔的增重效果有无差别?
创建分组变量“group”,测量尺度设为“名义”,赋值为“1”和“2”分别代表用饲料A饲养和用饲料B饲养;创建观察变量“time0”、“time1”、“time2”和“time3”,测量尺度设为“标度”,分别记录在试验开始时、第一个月、第二个月、第三个月时2组家兔的体重。对数据的变量和水平进行标签赋值后部分数据见图1。本案例数据可从“附件下载”处下载。
二、问题分析
重复测量数据分析往往会遇到基线数据和后续测量数据的条件不一致的情况,如针对某种治疗方法对镇痛效果的影响,测量了治疗前和治疗后多次时间点的镇痛效果,此时基线数据和后续多个测量数据的条件则不一致。对于这种情况,基线数据一般不应作为重复测量的第一次纳入重复测量方差分析。本案例也是如此,其中试验开始的测量数据与后面三次测量数据并不处于同一试验条件下,不适合当做重复测量数据进行分析,而应该当做协变量进行处理。
本案例的分析目的是比较A、B两种饲料对家兔的增重效果有无差别。由于3个时间点的数据属于重复测量数据,且有两个组别,一个协变量,可以使用两因素(时间因素time和分组因素group)重复测量协方差分析。但需要满足以下7个条件:
条件1:观察变量唯一,且为连续变量。本研究中观察变量只有体重,且为连续变量,该条件满足。
条件2:有两个分析因素。本研究有时间因素time和分组因素group两个因素,该条件满足。
条件3:观察变量为重复测量数据,即不满足独立性。本研究中两个组别在3个时间点时测量的体重均是针对同一批样本,因此不满足独立性,该条件满足。
条件4:存在一个或以上的协变量。本研究中试验开始的测量数据为协变量。
条件5:观察变量不存在显著的异常值。该条件需要通过软件分析后判断。
条件6:各组、各水平(时间点)观察变量为正态(或近似正态)分布。该条件需要通过软件分析后判断。
条件7:相互比较的各处理水平(组别)的总体方差齐。该条件需要通过软件分析后判断。
三、软件操作及结果解读
(一) 适用条件判断
条件5~7的判断均需要根据方差分析生成的残差进行分析,详见下文“方差分析”部分。
(二) 方差分析
1. 生成模型残差
(1) 软件操作
- 选择“分析”—“一般线性模型”—“重复测量” (图2)。
- 出现“重复测量定义因子”对话框(图3),“主体内因子名”处录入重复测量的因子名称,自定义名称。由于本案例是在3个时间点重复测量,所以此处将“因子”改为“时间”,下方“水平数”是填入测量次数,本例填“3”,然后点击“添加”。最后点击“定义”。
- 出现“重复测量”对话框(图4),将左侧3个变量“time1”、“time2”和“time3”选入右侧“主体内变量”中,将左侧变量“group”选入右侧“主体间因子”中,将“time0”选入“协变量”。此后的软件操作都基于该对话框。
- 在“重复测量”对话框中点击右侧“模型”,进入“模型”子对话框(图5),因为需要分析交互作用,所以保持默认,即默认“全因子”模型。
- 在“重复测量”对话框中点击右侧“图”,出现“轮廓图”子对话框(图6),将“时间”选入右侧“水平轴”中,将“group”选入右侧“单独的线条”中,然后点击“添加”,保持选中“折线图”,勾选“包括误差条形图”及“置信区间(95.0%)”,点击“继续”回到主对话框。
- 在“重复测量”对话框中点击右侧“EM 平均值”,出现“估算边际均值”子对话框(图7),将“时间”“group”和“group*时间”选入右侧“显示下列各项的平均值”列表框中,勾选“比较主效应”,下方“置信区间调整”选则“邦弗伦尼”,点击“继续”回到主对话框。
- 在“重复测量”对话框中点击右侧“保存”,出现“保存”子对话框(图8),勾选“库克距离”和“标准化”残差,点击“继续”回到主对话框。
- 在“重复测量”对话框中点击右侧“选项”,出现“选项”子对话框(图9),勾选“描述性分析”和“齐性检验”,点击“继续”回到主对话框,点击“确定”,则输出一系列结果。
(2) 结果解读
经过上述步骤在数据页面生成了3列标准化残差(ZRE_*)和3列库克距离(COO_*)共6个新变量,分别代表各重复测量时间点的标准化残差和库克距离(图10)。
2. 适用条件判断
(1) 条件5判断(异常值检测)
异常值检测有多种方法:
- 可以查看库克距离,一般认为当D<0.5时不是异常值点,当D>0.5时是异常值点。查看三列库克距离可知所有数值均<0.5(图11),因此不需要进行特殊处理。
- 可以查看标准化残差(ZRE_1),检查是否存在大于3或小于-3的离群值。查看3列标准化残差可知,均无超过3的绝对值。
(2) 条件6判断(正态性检验)
图12为3列残差的正态性检验结果,可知Time1时残差不服从正态分布,后两个时间点的残差均服从正态分布,总体可接受正态性,满足条件6。
(3) 条件7判断(方差齐性检验)
图13为组间方差齐性检验结果,可知Time1时残差不齐,后两个时间点的残差均齐;总体可认为方差齐。满足条件7。
(三) 球形假设检验
图14“莫奇来球形度检验”中给出了球形假设检验结果,W=0.976,P=0.822,大于0.05,满足球形假设,因此本案例可以直接采用非校正方法分析的结果。
当违背了球形假设条件时,需要进行epsilon (ε)校正。此处提供了3种一元方差校正方法:格林豪斯-盖斯勒、辛-费德特和下线。一般建议采用前两种方法,当epsilon (ε)<0.75时,使用格林豪斯-盖斯勒法,当epsilon (ε)>0.75时,使用辛-费德特法。当违背了球形假设条件时,如果单变量和多变量检验结果不一致,以多变量检验结果为准。
(四) 统计学描述与推断
1. 统计学描述
图15列出了A、B两组time1、time2、time3时间点的均值。
图16的估算边际均值图绘制了两组3个时间点体重的变化情况,可见两组的体重均有增加,并且增加的幅度有较大差异。
图17提供了两组3个时间点的“估算边际平均值”“标准误差”及均值的“95% 置信区间 (95%CI)”。因为经过了基线数据的校正,故此处均值和图15的统计描述结果不一致。
2. 交互作用判断
由于本案例有两个因素(一个为不同的测量时间,另一个为不同的组别),因此需要首先判断两个因素之间是否存在交互作用。如果交互作用有统计学意义,则需要分析单独效应。
图18为“主体内效应检验”,第一行是“假定球形度”结果,当满足球形性假设时查看该行统计推断结果。此处时间与group之间的交互作用结果为F时间*group=46.446,P<0.001,提示时间与group之间的交互作用有统计学意义。因此,本案例需要分析单独效应。
(五) 单独效应分析
1. 软件操作
回到“重复测量”对话框,点击下方“粘贴”,则出现“IBM SPSS Statistics 语法编辑器”界面,编辑区中现有的语法是在“重复测量”对话框中已经通过菜单命令执行的操作(图19)。
单独效应分析需要在第10行“/EMMEANS=TABLES(group*时间) WITH(time0=MEAN)”后输入“/EMMEANS=TABLES(group*时间) WITH(time0=MEAN) COMPARE(group) ADJ(BONFERRONI)”,并复制该语句,将COMPARE后的“group”改为“时间” (图20)。COMPARE(group)是指根据变量“group”提供单独效应结果;ADJ(BONFERRONI)是指对使用Bonferroni法进行各组的多重比较。若无需多重比较,可删去。
2. 时间的单独效应分析
时间的单独效应是指在group的不同组中比较时间因素的差异。“多变量检验”结果(图21)给出了4种统计推断结果,可知A、B两种饲料喂养条件下不同时间点的体重增量差异均有统计学意义(P<0.001)。因为时间有3组,所以要具体了解哪两组之间存在差异就要通过事后检验的两两比较。
进一步通过“邦弗罗尼”法分别对A、B两组内3个时间点数据进行两两比较,结果见“成对比较”(图22),A饲料喂养时,相比time1,time2和time3时的体重增量逐渐增加,差异均有统计学意义(P<0.001);相比time2,time3时的体重增量也增加,差异有统计学意义(P<0.001)。B饲料喂养时,相比time1,time2和time3时的体重增量逐渐增加,差异均有统计学意义(P<0.001);相比time2,time3时的体重增量也增加,差异有统计学意义(P<0.001)。
3. 组间的单独效应分析
由“单变量检验”结果(图23)可知,time1、time2、time3时两组间的体重增量差异均有统计学意义(P<0.001)。结合“成对比较”结果(图24)可知,time1时两组间的体重增量差异为0.259 kg (P<0.001),time2时两组间的体重增量差异扩大至1.732 kg (P<0.001),time3时两组间的体重增量差异进一步扩大至2.318 kg (P<0.001)。
四、结论
本研究采用两因素重复测量方差分析比较A、B两种饲料对家兔的增重效果有无差别。通过库克距离结果和专业知识判断,数据不存在需要特殊处理的异常值;通过对残差进行正态性检验(Shapiro-Wilk检验),提示各时间点数据服从正态分布;通过方差齐性检验(Levene’s检验),提示每个时间点的两组之间都满足方差齐性;球形度检验提示,满足球形假设(W=0.976,P=0.822);组别与时间存在交互作用(F时间*group=46.446,P<0.001),故进行单独效应分析。
时间的单独效应分析显示,A、B两种饲料喂养条件下不同时间点的体重增量差异均有统计学意义(P<0.001)。通过“邦弗罗尼”法进行两两比较显示,A饲料喂养时,相比time1,time2和time3时的体重增量逐渐增加,差异均有统计学意义(P<0.001);相比time2,time3时的体重增量也增加,差异有统计学意义(P<0.001)。B饲料喂养时,相比time1,time2和time3时的体重增量逐渐增加,差异均有统计学意义(P<0.001);相比time2,time3时的体重增量也增加,差异有统计学意义(P<0.001)。
组间的单独效应分析显示,time1、time2、time3时两组间的体重增量差异均有统计学意义(P<0.001)。time1时两组间的体重增量差异为0.259 kg (P<0.001),time2时两组间的体重增量差异扩大至1.732 kg (P<0.001),time3时两组间的体重增量差异进一步扩大至2.318 kg (P<0.001)。
综上,A饲料对家兔的增重效果更好。