关键词:jamovi; 协方差分析; 单因素协方差分析; 平行性检验; 平行线检验
一、案例介绍
为研究A(代码为1)、B(代码为2)、C(代码为3)三种饲料对增加小鼠体重的影响,将初始体重相近的45只小鼠随机分成三组,分别喂养A、B、C三种饲料,但在实验设计时未对小鼠的进食量加以限制,现测得三组小鼠的进食量和所增体重,请推断A、B、C三种饲料对小鼠的增重效果是否有差别?对数据的变量进行标签赋值后部分数据见图1。本文案例可从“附件下载”处下载。
二、问题分析
本案例的分析目的是比较A、B、C三种饲料对增加小鼠体重的影响,即A、B、C三组体重增量是否存在差异。但显然,每个老鼠的进食量会对体重增量产生影响,因此针对这种情况可将进食量作为体重增量的影响因素进行单因素协方差分析。但需要满足九个条件:
条件1:观察变量为连续变量。本研究中观察变量为体重增量,为连续变量,该条件满足。
条件2:自变量存在2个或多个分组。本研究中自变量为A、B、C三组,该条件满足。
条件3:协变量是连续变量。本研究中协变量为进食量,为连续变量,该条件满足。
条件4:各研究对象之间相互独立。本研究中各个研究对象均为独立样本,不存在互相干扰的情况,该条件满足。
条件5:观察变量不存在显著的异常值,该条件需要通过软件分析后判断。
条件6:各组内协变量和因变量之间存在线性关系,该条件需要通过软件分析后判断。
条件7:各组资料都来自正态分布的总体(样本数据呈正态或近似正态分布),该条件需要通过软件分析后判断。
条件8:组间因变量的方差齐,该条件需要通过软件分析后判断。
条件9:各组内协变量和因变量的回归直线平行,即通过平行性检验,该条件需要通过软件分析后判断。
三、软件操作及结果解读
(一) 适用条件判断
1. 条件5判断(异常值判断)
(1) 软件操作
① 选择“分析”—“探索”—“描述”,将观察变量“进食量”和“所增体重”选入右侧“变量”框,将“分组”选入右侧“拆分”框(图2)。
② 在“统计”下的“样本量”中勾选“个案数”、“缺失”,在“集中趋势”中勾选“均数”、“中位数”,在“离散趋势”中勾选“标准差”、“最小值”和“最大值”(图3),结果如表1所示。
③ 在“绘图”下的“箱线图”中勾选“箱线图”和“数据”,“数据”下拉菜单中选择“散点”(图4),结果如图5-1—图5-2所示。
(2) 结果解读
表1“描述”表格中,列出了各组观察变量的最小值和最大值,依据专业尚不能认为存在异常值的情况;此外,图5-1中的箱线图也未提示任何异常值和极端值;虽然图5-2的 B组中出现了一个极端值,但根据专业尚不能认定为异常值。综上,本案例未发现需要删除的异常值,满足条件5。
2. 条件6判断(线性关系检验)
(1) 软件操作
① 选择“分析”—“探索”—“散点图”,将“进食量”选入“X轴”框,将“所增体重”选入“Y轴”框,将“分组”选入“分组”框;在“添加回归线”中勾选“线性”和“标准误差”(图6),结果如图7所示。
② 选择“数据”—“筛选器”,在对话框公式中输入“分组” == “A”(图8),即在数据集中选择A组数据进行分析。
③ 选择“分析”—“回归”—“相关矩阵”,将“进食量”、“所增体重”选入右框,勾选“Pearson系数”和“报告P值”(图9),结果如表2所示。
④ 参照②③操作,计算B组和C组两组内“进食量”与“所增体重”的相关系数,结果如表3和表4所示。
(2) 结果解读
由图7可知,A、B、C三组内“进食量”与“所增体重”均呈现线性关系;表2—表4“相关矩阵”分析列出了详细的相关性检验结果,可见相关系数均较高(>0.8),P值均<0.001。综上,本案例各组内协变量和因变量之间均存在线性关系,满足条件6。
3. 条件7判断(正态性检验)
(1) 软件操作
① 选择“分析”—“方差分析”—“协方差分析”,将“所增体重”选入右侧“因变量”框,将“分组”选入“固定因子”框,将“进食量”选入“协变量”框(图10)。
② 在“模型”中将“分组”、“进食量”选入右侧“模型项”框,再将“分组”、 “进食量”同时选中,将其交互项“分组*进食量”选入右侧“模型项”框(图11);在“保存”中勾选“残差”(图12)。
③ 在“适用条件判断”中勾选“正态性检验”和“Q-Q图”(图13),结果如图14和表5所示。
(2) 结果解读
因变量残差的Q-Q图(图14)上散点基本围绕对角线分布,提示残差服从正态分布;正态检验结果(表5)显示P值为0.682>0.1,也表明残差满足正态性要求。综上可知,本案例满足条件7。
4. 条件8判断(方差齐性检验)
(1) 软件操作
在“适用条件判断”中勾选“方差齐性检验”(图15),结果如表6所示。
(2) 结果解读
由表6的“方差齐性检验(Levene’s)”结果可知,F=2.066,P=0.139,提示本案例组间因变量的方差齐,满足条件8。
5. 条件9判断(平行性检验)
平行性检验通过判断“分组”与“进食量”的交互项是否有统计学意义决定。
(1) 软件操作
在“模型拟合”中,勾选“整体模型检验”(图16)。
(2) 结果解读
在表7“协方差分析”表格中,“整体模型”列的F值=81.721,P值 <0.001,表示整体模型检验具有统计学意义。“group*Food”的交互项检验结果为,Fgroup*Food =0.186,Pgroup*Food=0.831,表示交互项无统计学意义,即满足平行性检验。因此,本案例满足条件9。
(二) 统计描述
1. 软件操作
① 既然“分组*进食量”的交互项无统计学意义,那么就不应该放在模型中。因此,在“模型”对话框中需要将“模型种类”框中“分组*进食量”移除,只保留“分组”和“进食量”。
② 在“估算边际均值”中将“分组”选入右侧“边际均值”框,在“输出”下勾选“边际均值图”和“边际均值表”,结果如图16和表8所示。
2. 结果解读
表1中列出了A、B、C三组体重增量分别为36.633±20.369 kg、46.427±21.389 kg、119.027±31.944 kg,三组的进食量分别为273.220±46.247 kg、274.147±41.661 kg、493.587±73.797 kg。表8“估算边际均值-group”表格中提供了三组的“均值”、“标准误”及均值的“95%置信区间”,A、B、C三组体重增量的估算边际均值分别为64.649 (95%CI: 55.552~73.746) kg、74.091 (95%CI: 65.037~83.144) kg、63.347 (95%CI: 50.054~76.640) kg,可见三组体重增量的估算边际均值与三组体重增量的均值存在较大差异。图17的估算边际均值图也绘制了三组体重增量的情况,可见B组最高、A组其次、C组最低。但这种差异是否具有统计学意义,还需要依据统计学推断结果做出判断。
(三) 统计学推断
1. 软件操作
在“效应量”中补勾选“Ƞ²值”、“偏Ƞ²”、“ω²”(图18)。
2. 结果解读
表9“协方差分析-weight”结果显示,进食量这一列的F值=100.524,P值<0.001,提示进食量的确对所增体重具有影响,Ƞ²p为0.710,ω²为0.679,为大效应,因此需要将其列为协变量进行控制。分组这一列的F值=1.999,P值=0.149,Ƞ²p为0.089,ω²为0.014,为小效应,提示三组小鼠体重的增重效果差异无统计学意义。
(四) 事后检验(两两比较)
本案例中由于三组间整体比较差异无统计学意义,因此无需再进行事后两两比较。假设本案例三组间整体比较差异有统计学意义,其分析步骤如下。
1. 软件操作
在“事后检验”框中按照图19勾选相应选项。本案例选择“Bonferroni法”,“未校正”为输出未校正的P值。
2. 结果解读
“事后比较-group”表格中提供了各组两两比较的“均数差”、“标准误”、“自由度”、“t值”、“P值”和“Pbonferroni”。可知,三组中任意两组比较差异均无统计学意义(P>0.05)。
四、结论
本研究采用单因素协方差分析,判断在调整进食量后A、B、C三种饲料对小白鼠的增重效果是否有差别。通过专业知识判断,数据不存在异常值;通过绘制散点图和相关性分析,提示各组内协变量和因变量之间存在线性关系;通过Shapiro-Wilk检验,提示各组数据满足正态性要求;通过Levene’s检验,提示各组因变量满足方差齐性要求;通过平行性检验,发现“分组*进食量”的交互项无统计学意义(F分组*进食量 =0.186,P分组*进食量=0.831),提示满足平行性检验要求。
A、B、C三组小白鼠体重增量分别为36.633±20.369 kg、46.427±21.389 kg、119.027±31.944 kg。单因素协方差分析显示,在调整进食量后A、B、C三组体重增量的估算边际均值分别为64.649 (95%CI: 55.552~73.746) kg、74.091 (95%CI: 65.037~83.144) kg、63.347 (95%CI: 50.054~76.640) kg,差异无统计学意义(F分组=1.999,P分组=0.149),Ƞ²p为0.089,ω²为0.014,为小效应。本研究结果提示A、B、C三种饲料对小白鼠体重的增重效果无差异。
五、知识小贴士
- 协方差分析是针对在实验设计阶段难以控制其取值水平,或者无法严格控制的因素,在统计分析阶段对其进行统计控制的一种分析方法,实质为线性回归分析和方差分析的结合。适用于完全随机设计、随机区组(配伍)设计、拉丁方设计、析因设计等类型的方差分析。
- 协方差分析一般要求协变量在组间的观察范围相差不宜太大(分析前最好先对协变量均数间的差别作假设检验),否则修正后的边际均值的差值可能会落在回归线的延长线上,此时回归线外推后是否仍然满足平行线和线性关系的条件尚不可知,其协方差分析的结论可能不一定准确。
六、分析小技巧
- 对协方差分析的正态性条件考察应检验因变量残差的正态性,此时检验残差整体的正态性即可,无须检验每组残差的正态性。在jamovi中“ ANCOVA”模块下,“Shapiro-Wilk”检验的结果是对多组整体残差的正态性检验结果。该结果等同于对因变量残差在“Descriptives”模块下的正态性检验结果。
- 对协方差分析的方差齐性条件考察应检验组间因变量残差是否相等。在jamovi中“ANCOVA”模块下,“Homogeneity test”的方差齐性检验结果,等同于对因变量残差在 “One-Way ANOVA”模块中的“Homogeneity test”方差齐性检验结果。