关键词:SPSS; 重复测量; 重复测量资料; 重复测量方差分析; 两因素重复测量方差分析; 球形检验; 交互作用; 主效应; 单独效应
一、案例介绍
研究A、B两种饲料对家兔的增重效果,选择20只家兔,随机分成两组,第一组用饲料A饲养,第二组用饲料B饲养,并于试验开始后第一个月(time1)、第二个月(time2)、第三个月(time3)分别测量2组家兔体重,试比较A、B两种饲料对家兔的增重效果有无差别?
创建代表分组情况的变量“group”,测量尺度均设为“名义”,赋值为“1”和“2”分别代表用饲料A饲养和用饲料B饲养;创建观察变量“time1”、“time2”和“time3”,测量尺度设为“标度”,分别记录在试验开始后,第一个月、第二个月、第三个月时2组家兔的体重。对数据的变量和水平进行标签赋值后部分数据见图1。本文案例可从“附件下载”处下载。
二、问题分析
本案例的分析目的是比较A、B两种饲料对家兔的增重效果有无差别。由于3个时间点的数据属于重复测量数据,且有两个组别,可以使用两因素(时间因素time和分组因素group)重复测量方差分析。但需要满足以下6个条件:
条件1:观察变量唯一,且为连续变量。本研究中观察变量只有体重,且为连续变量,该条件满足。
条件2:有两个分析因素。本研究有时间因素time和分组因素group两个因素,该条件满足。
条件3:观察变量为重复测量数据,即不满足独立性。本研究中两个组别在3个时间点时测量的体重均是针对同一批样本,因此不满足独立性,该条件满足。
条件4:观察变量不存在显著的异常值,该条件需要通过软件分析后判断。
条件5:各组、各水平(时间点)观察变量为正态(或近似正态)分布,该条件需要通过软件分析后判断。
条件6:相互比较的各处理水平(组别)的总体方差齐,该条件需要通过软件分析后判断。
三、软件操作及结果解读
(一) 适用条件判断1
1. 条件4判断(异常值判断)
(1) 软件操作
①选择“分析”—“描述统计”—“探索”(图2)。
②在“探索 ”对话框中将观察变量“time1”、“time2”和“time3”选入右侧“因变量列表”框,将分组变量“group”选入右侧“因子列表”框,点击“确定”(图3)。
(2) 结果解读
异常值通过箱线图和专业知识进行判断,图4为三个时间点时两组的箱线图,图4-2和图4-3均提示存在异常值。查看数据表可以发现在time2的第13位和time3的第14位数值分别为2.8 kg和7.6 kg,依据专业可判定该值可以保留。综上,本案例未发现需要处理的异常值,满足条件3。
2. 条件5判断(正态性检验)
(1) 软件操作
① 选择“分析”—“描述统计”—“探索”(图2)。
② 在“探索”对话框中将观察变量“time1”、“time2”和“time3”选入右侧“因变量列表”框,将分组变量“group”选入右侧“因子列表”框,点击“确定”(图3)。
(步骤①②同条件4判断的软件操作,故条件4和条件5判断可同时在“探索”对话框中进行)。
③ 在“图”子对话框中勾选“含检验的正态图”,取消勾选“茎叶图”,其他不变,点击“继续”(图5),回到“探索 ”对话框后点击“确定”,则会输出结果。
(2) 结果解读
图6显示了两种正态性检验的结果,Kolmogorov-Smirnov (柯尔莫哥洛夫-斯米诺夫,K-S)检验和Shapiro-Wilk (夏皮罗-威尔克,S-W)检验。K-S检验适用于大样本资料,本案查看S-W检验结果,可见各组P值均>0.1,提示所有时间点下两组的数据均服从正态分布。图7为在time1时两组正态性检验的Q-Q图,可见散点基本围绕对角线分布,提示数据服从正态性分布。其他时间点时两组的Q-Q图(未展示)也显示散点基本围绕对角线分布,提示数据服从正态性分布。综上,本案例满足条件5。关于正态性检验的注意事项详见文章(医学统计学核心概念及重要假设检验的软件实现(2/4)——正态性假设检验的SPSS实现)。
3. 条件6判断(方差齐性检验)
方差齐性检验详见后文。
(二) 软件实现步骤
进行方差齐性检验、球形假设检验以及两因素重复测量方差分析时都需要基于重复测量窗口,以下首先介绍调用重复测量窗口的操作步骤。
1. 调用“重复测量窗口”
①选择“分析”—“一般线性模型”—“重复测量” (图8)。
②出现“重复测量定义因子”对话框,“主体内因子名”处要录入重复测量的因子名称,自定义名称。由于本案例是在3个时间点重复测量,所以此处将“因子”改为“时间”,下方“水平数”是填入测量次数,则填入“3”,如图9-1所示,然后点击“添加”,如图9-2所示。最后点击“定义”。
③出现“重复测量”对话框,将左侧三个变量“time1”、“time2”和“time3”选入右侧“主体内变量”中,将左侧变量“group”选入右侧“主体间因子”中,如图10所示。此后的软件操作都基于该窗口。
2. “重复测量窗口”设置
①在“重复测量”对话框中点击右侧“模型”,保持默认,即全因子模型,因为需要分析交互作用(图11)。
在“重复测量”对话框中点击右侧“图”,出现“轮廓图”子对话框,将“时间”选入右侧“水平轴”中,将“group”选入右侧“单独的线条”中,然后点击“添加”,保持选中“折线图”,如图12所示,点击“继续”回到主对话框。
③在“重复测量”对话框中点击右侧“EM 平均值”,出现“重复测量:估算边际均值”子对话框,将“时间”“group”和“group*时间”选入右侧“显示下列各项的均值”列表框中,勾选“比较主效应”,下方“置信区间调整”选则“邦弗伦尼”,如图13所示,点击“继续”回到主对话框。
④在“重复测量”对话框中点击右侧“选项”,出现子对话框,勾选“描述性分析”和“齐性检验”,如图14所示,点击“继续”回到主对话框,点击“确定”,则输出一系列结果。
(三) 适用条件判断2(方差齐性检验)
图15“误差方差的莱文等同性检验 (Levene’s方差齐性检验)”主要查看每个时间点第一行“基于平均值”的结果,三个时间点方差齐性检验结果分别为F=1.393、P=0.253;F=1.741、P=0.204;F=0.000、P=0.988;提示每个时间点的两组之间都满足方差齐性。本案例满足条件6。关于方差齐性检验的更多内容请阅读(医学统计学核心概念及重要假设检验的软件实现(4/4)——方差齐性检验及SPSS实现)。
(四) 球形假设检验
图16“莫奇来球形度检验”中给出了球形假设检验结果,W=0.886,P=0.356,大于0.05,满足球形假设,因此本案例可以直接采用非校正方法分析的结果。当违背了球形假设条件时,需要进行epsilon (ε)校正。此处提供了三种一元方差校正方法:格林豪斯-盖斯勒、辛-费德特和下线。一般建议采用前两种方法,当epsilon (ε)<0.75时,使用格林豪斯-盖斯勒法,当epsilon (ε)>0.75时,使用辛-费德特法。
(五) 统计描述与推断
1. 统计描述
图17列出了A、B两组time1、time2、time3时间点的均值分别为1.54±0.33、3.91±0.91、5.60±0.89和1.51±0.27、3.86±0.58、5.67±0.91 kg。
图18的估算边际均值图绘制了两组三个时间点体重的变化情况,可见两组的体重均有增加,并且增加的幅度基本保持一致。
图19提供了两组三个时间点的“估算边际平均值”、“标准误差”及均值的“95% Confidence Interval (95%CI)”。此处均值和图16的统计描述结果一致。
2. 交互作用判断
由于本案例有两个因素(一个为时间因素时间,另一个为分组因素group),因此需要首先判断两个因素之间是否存在交互作用。如果交互作用有统计学意义,则需要分析单独效应。
图20为“主体内效应检验”,第一行是“假定球形度”结果,当满足球形性假设时查看该行统计推断结果。此处时间与group之间的交互作用结果为F时间*group=0.106,P=0.900,提示时间与group之间的交互作用无统计学意义。因此,本案例可直接以主效应分析结果进行判断,如果交互作用有统计学意义,则需要分析单独效应。
3. 时间效应分析
图20中对“时间”的检验结果为F时间=437.308,P<0.001,认为体重变化的时间趋势有统计学意义。
4. 时间变化趋势及两两比较
已经发现不同时间点的体重存在差异,则需要进一步探讨体重变化符合何种变化曲线。由“主体内对比检验”可知,“线性”关系的F时间=673.588,P<0.001(图21),结合轮廓图(图18)也可知,线性关系符合变化趋势。
已经发现不同时间体重存在差异,则需要进一步两两比较。图22“成对比较”结果中提供了各时间点两两比较的“平均值差值”、“标准误差”、“显著性(校正P值)”和“95% Confidence Interval (95%CI)”。可知,随着时间的延长,各时刻与time1时刻相比,均值差逐渐增大。time2比time1时均值增加了2.360 kg,至time3时增加了4.110 kg,time2到time3时增加了1.750 kg,差异均有统计学意义(P<0.001)。
5. 组间效应分析
图23为“主体间效应检验”,其中对“group”的检验结果可知,Fgroup=0.000,P=0.990,表示两种饲料对家兔的增重效果差异无统计学意义。
四、结论
本研究采用两因素重复测量方差分析比较A、B两种饲料对家兔的增重效果有无差别。通过专业知识判断,数据不存在需要删除的异常值;通过Shapiro-Wilk检验,提示各组数据服从正态分布;通过Levene’s检验,提示每个时间点的两组之间都满足方差齐性;球形度检验提示,满足球形假设(W=0.886,P=0.356);组别与时间无交互作用(F时间*group=0.106,P=0.900),故进行主效应分析。
A、B两组在试验开始后第1个月、第2个月和第3个月时的体重分别为1.54±0.33、3.91±0.91、5.60±0.89 kg和1.51±0.27、3.86±0.58、5.67±0.91 kg。两因素重复测量方差分析结果显示,在试验开始后第1个月、第2个月和第3个月2组家兔的体重均呈上升趋势(F时间=437.308,P<0.001),但两种饲料对家兔的增重效果无差异(Fgroup=0.000,P=0.990)。进一步采用“Bonferroni”校正法进行两两比较可知,随着时间的延长,第1个月和第2个月与试验开始时相比,体重增加均有统计学意义(P<0.001)。综上可知,两种饲料对家兔的增重效果无差异。