关键词:SPSS; 重复测量; 重复测量资料; 重复测量方差分析; 两因素重复测量方差分析; 球形检验; 交互作用; 主效应; 单独效应; 协方差分析; 基线数据
一、案例介绍
研究A、B两种饲料对家兔的增重效果。选择20只家兔,随机分成两组,第一组用饲料A饲养,第二组用饲料B饲养,并于实验开始时(time0)、试验开始后第一个月(time1)、第二个月(time2)、第三个月(time3)分别测量2组家兔体重,试比较A、B两种饲料对家兔的增重效果有无差别?
创建分组变量“group”,测量尺度设为“名义”,赋值为1=饲料A饲养,2=饲料B饲养;创建观察变量time0、time1、time2和time3,测量尺度设为“标度”,分别记录在试验开始时、第一个月、第二个月、第三个月时2组家兔的体重。对数据的变量和水平进行标签赋值后部分数据见图1。本案例数据可从“附件下载”处下载。
二、问题分析
重复测量数据分析往往会遇到基线数据和后续测量数据的条件不一致的情况,如针对某种治疗方法对镇痛效果的影响,测量了治疗前和治疗后多次时间点的镇痛效果,此时基线数据和后续多个测量数据的条件不一致。对于这种情况,基线数据一般不应作为重复测量的第一次纳入重复测量方差分析。本案例也是如此,其中试验开始的测量数据与后面3次测量数据并不处于同一试验条件下,不适合当做重复测量数据进行分析,而应该当做协变量进行处理。
本案例的分析目的是比较A、B两种饲料对家兔的增重效果有无差别。由于3个时间点的数据属于重复测量数据,且有两个组别,一个协变量,可以使用两因素(时间因素time和分组因素group)重复测量协方差分析。但需要满足以下7个条件:
条件1:观察变量唯一,且为连续变量。本研究中观察变量只有体重,且为连续变量,该条件满足。
条件2:有两个分析因素。本研究有时间因素time和分组因素group两个因素,该条件满足。
条件3:观察变量为重复测量数据,即不满足独立性。本研究中两个组别在3个时间点时测量的体重均是针对同一批样本,因此不满足独立性,该条件满足。
条件4:存在一个或以上的协变量。本研究中试验开始的测量数据为协变量。
条件5:观察变量不存在显著的异常值。该条件需要通过软件分析后判断。
条件6:各组、各水平(时间点)观察变量为正态(或近似正态)分布。该条件需要通过软件分析后判断。
条件7:相互比较的各处理水平(组别)的总体方差齐。该条件需要通过软件分析后判断。
三、软件操作及结果解读
(一) 适用条件判断
条件5~7的判断均需要根据方差分析生成的残差进行分析,详见下文“方差分析”部分。
(二) 方差分析
1. 生成模型残差
(1) 软件操作
- 选择“分析”—“一般线性模型”—“重复测量” (图2)。
- 打开“重复测量定义因子”对话框(图3),“主体内因子名”处要录入重复测量的因子名称,自定义名称。由于本案例是在3个时间点重复测量,所以此处将“因子”改为“时间”,下方“级别数”是填入测量次数,则填入“3”,然后点击“添加”,最后点击“定义”。
- 出现“重复测量”对话框(图4),将左侧time1、time2和time3选入右侧“主体内变量”中,将左侧group选入右侧“主体间因子”中,将左侧time0选入右侧“协变量”中,此后的软件操作都基于该窗口。
- 在图4中点击右侧“模型”,打开“模型”子对话框(图5),因为需要分析交互作用,所以保持默认,即全因子模型,点击“继续”回到图4。
- 在图4中点击右侧“图”,打开“轮廓图”子对话框(图6),将左侧“时间”选入右侧“水平轴”中,将左侧group选入右侧“单独的线条”中,然后点击“添加”;保持选中“折线图”,勾选“包括误差条形图”及“置信区间(95.0%)”,点击“继续”回到图4。
- 在图4中点击右侧“EM 平均值”,打开“估算边际均值”子对话框(图7),将“时间”“group”和“group*时间”选入右侧“显示下列各项的均值”列表框中,勾选“比较主效应”,下方“置信区间调整”选则“邦弗伦尼”,点击“继续”回到图4。
- 在图4中点击右侧“保存”,打开“保存”子对话框(图8),勾选“库克距离”和残差“标准化”,点击“继续”回到图4。
- 在图4中点击右侧“选项”,出现“选项”子对话框(图9),勾选“描述统计”和“齐性检验”点击“继续”回到图4后,点击“确定”即可输出相关结果。
(2) 结果解读
经过上述步骤在数据页面生成了3列标准化残差“ZRE_1”和3列库克距离“COO_1”6个新变量,分别代表各重复测量时间点的标准化残差和库克距离(图10)。
2. 适用条件判断
(1) 条件5判断(异常值检测)
异常值判断可通过查看库克距离或标准化残差,结果见图11。
- 一般认为当库克距离(D)≤0.5时不是异常值点,当D>0.5时是异常值点。查看3列库克距离可知有一个数据的库克距离为0.51,但基于专业判断该原始数据是可能出现的,因此不需要进行特殊处理。
- 标准化残差(ZRE_1)的绝对值>3可能为离群值。查看3列标准化残差可知,残差绝对值均未超过3
基于以上,本案例数据满足条件5。
(2) 条件6判断(正态性检验)
残差的正态性检验结果(图12)显示,两种方法检测3列变量残差的均P>0.1,可认为接受正态性,满足条件6。
(3) 条件7判断(方差齐性检验)
组间方差齐性检验结果(图13)显示,3个时间点方差齐性检验均P>0.1;可认为每个时间点的两组之间都满足方差齐性,满足条件7。
(三) 球形假设检验
“莫奇来球形度检验”结果(图14)显示,W=0.849,P=0.271>0.05,满足球形假设,因此本案例可以直接采用非校正方法分析的结果。
此外,若不满足球形假设,则需进行epsilon (ε)校正。此处提供了3种一元方差校正方法:格林豪斯-盖斯勒、辛-费德特和下线。一般建议采用前两种方法,当epsilon (ε)≤0.75时,使用格林豪斯-盖斯勒法;当epsilon (ε)>0.75时,使用辛-费德特法。特别说明的是,不满足球形检验的前提下,若单变量和多变量检验结果不一致,则以多变量检验结果为准。
(四) 统计描述及推断
1. 统计描述
“描述统计”结果(图15)列出了A、B两组time1、time2、time3时间点的均值。
估算边际均值图(图16)绘制了两组3个时间点体重的变化情况,可见两组的体重均有增加,并且增加的幅度基本保持一致。
经过基线数据校正后的“分组*时间”结果(图17)提供了两组3个时间点的估算边际平均值、标准误差及均值的95%置信区间(95%CI)。因为图15未经过基线数据校正,所以图17的均值和图15不一致。
2. 交互效应
由于本案例有两个因素(一个为时间因素time*,另一个为分组因素group),因此需要首先判断两个因素之间是否存在交互作用。如果交互作用有统计学意义,则需要分析单独效应。
“主体内效应检验”结果(图18),第一行是“假定球形度”结果,当满足球形性假设时查看该行统计推断结果。此处时间与group之间的交互作用结果为F时间*group=1.518,P=0.234,提示时间与group之间的交互作用无统计学意义。因此,本案例可直接以主效应分析结果进行判断,如果交互作用有统计学意义,则需要分析单独效应。
3. 时间效应分析
“主体内效应检验”结果(图18)显示,F时间=3.497,P=0.042,认为不同时间点体重变化比较,差异有统计学意义。
因发现不同时间点的体重变化存在差异,所以进一步探讨随着时间推移的体重变化趋势符合哪种类型的曲线。由“主体内对比检验”结果(图19)可知,“线性”关系的F时间=5.089,P=0.038(图19),结合轮廓图(图16)可知,随着时间推移,体重变化呈线性。
“成对比较”结果(图20)为不同时间点体重变化两两比较结果,可知随着时间推移,各时刻与time1时刻相比,均值差逐渐增大。time2比time1时均值增加了2.065 kg,至time3时增加了3.815 kg,time2到time3时增加了1.750 kg,各时间点之间体重变化两两比较,差异均有统计学意义(P<0.001)。
4. 组间效应分析
“主体间效应检验”结果(图21)显示,Fgroup=0.622,P=0.441,可认为两种饲料对家兔的增重效果比较,差异无统计学意义。
四、结论
本研究采用两因素重复测量方差分析比较A、B两种饲料对家兔的增重效果有无差别。通过库克距离和专业知识判断,数据不存在需要特殊处理的异常值;通过对残差进行Shapiro-Wilk检验,提示各时间点数据服从正态分布;通过Levene’s检验,提示每个时间点的两组之间都满足方差齐性;球形度检验提示,满足球形假设(W=0.849,P=0.271);组别与时间无交互作用(F时间*group=1.518,P=0.234),故进行主效应分析。
两因素重复测量方差分析结果显示,在试验开始后第1个月、第2个月和第3个月2组家兔的体重均呈线性上升趋势(F时间=3.497,P=0.042;“线性”关系的F时间=5.089,P=0.038),但两种饲料对家兔的增重效果无差异(Fgroup=0.622,P=0.441)。进一步采用“Bonferroni”校正法进行两两比较可知,随着时间推移,第二个月和第三个月与第一个月体重变化比较,差异均有统计学意义(P<0.001)。综上可知,两种饲料对家兔的增重效果无差异。