单因素协方差分析(One-Way ANCOVA)——MedCalc软件实现

发布于 2022年8月17日 星期三 22:12:03 浏览:2234
原创不易,转载请注明来源,感谢!
附件下载:
单因素协方差分析.zip 请勿重复点击,如无响应请耐心等待或稍后再试。

在前面文章中介绍了单因素协方差分析(One-Way ANCOVA)的假设检验理论,本篇文章将实例演示在MedCalc软件中实现单因素协方差分析的操作步骤。

关键词:MedCalc; 协方差分析; 单因素协方差分析; 平行性检验; 平行线检验

一、案例介绍

为研究A、B、C三种饲料对增加小鼠体重的影响。将初始体重相近的45只小鼠随机分成三组,分别喂养A、B、C三种饲料,但在实验设计时未对小鼠的进食量加以限制,现测得三组小鼠的进食量(Food)和所增体重(Weight),请推断A、B、C三种饲料对小鼠的增重效果是否有差别?部分数据见图1,案例数据可从“附件下载”处下载。

图 1

二、问题分析

本案例的目的是比较A、B、C三种饲料对增加小鼠体重的影响,即A、B、C三组体重增量是否存在差异。但显然,每个老鼠的进食量会对体重增量产生影响,因此针对这种情况可将进食量作为体重增量的影响因素进行单因素协方差分析(One-Way ANCOVA)。但需要满足9个条件:

条件1:观察变量为连续变量。本研究中观察变量为体重增量,为连续变量,该条件满足。

条件2:自变量存在2个或多个分组。本研究中自变量为A、B、C三组,该条件满足。

条件3:协变量是连续变量。本研究中协变量为进食量,为连续变量,该条件满足。

条件4:各研究对象之间相互独立。本研究中各个研究对象均为独立样本,不存在互相干扰的情况,该条件满足。

条件5:观察变量不存在显著的异常值。该条件需要通过软件分析后判断。

条件6:各组内协变量和因变量之间存在线性关系。该条件需要通过软件分析后判断。

条件7:各组资料都来自正态分布的总体(样本数据呈正态或近似正态分布)。该条件需要通过软件分析后判断。

条件8:组间因变量的方差齐。该条件需要通过软件分析后判断。

条件9:各组内协变量和因变量的回归直线平行,即通过平行性检验。该条件需要通过软件分析后判断。

三、软件操作及结果解读

(一)数据准备

  • 打开MedCalc软件,导入数据如图2所示
图 2
  • 点击左侧“变量”,出现“变量”对话框,在此处选中需要进行标签设置的变量,然后点击右侧“属性”(图3),即可出现“变量属性”对话框
图 3
  • 在“变量属性”对话框中分别设置变量“Food”、“group”、“Weight”的标签,如图4~6所示,其中“group”作为分类变量,还可以通过“扫描数据”进行数值标签的设置,记录每个数值分别代表哪一个组别
图 4
图 5
图 6

(二)适用条件判断

条件6~9的判断均需要根据方差分析生成的残差进行分析,详见下文“方差分析”部分。

(三) 方差分析

1. 计算相关结果并生成模型残差

  • 选择“统计”—“方差分析”—“协方差分析...”(图7)
图 7
  • 在“协方差分析”对话框中,“因变量”中选择“Weight”,“因子”中选择“group”,“协变量”中选择“Food”,其他保持默认不变,点击“确定”(图8),可得到相关分析结果
图 8
  • 在分析结果最右下角点击“保存残差”,出现图9页面,“选项”下勾选“标准化”,点击确定。在数据视图页面可见生成了一列新的变量“ANCOVA_Resid1”,即为模型的标准化残差
图 9
图 10

2. 适用条件判断

(1) 条件5判断(异常值检测)

选择“统计”—“异常值检测”(图11);将“ANCOVA_Resid1”选入“变量”,其他设置见图12。

图 11
图 12

图13为残差的异常值检测结果,显示未发现异常值。

图 13
(2) 条件6判断(协变量与因变量之间的线性关系检验)

图14为对象间效应检验结果,显示进食量“Food”对应的回归系数的显著性检验结果为F=100.524,P<0.001,可以认为进食量的回归系数有统计学意义,即进食量和体重增量存在线性关系(此处也可以先绘制进食量“Food”与体重增量“Weight”之间的散点图,观察其线性趋势,请读者自行操作)。满足条件6。

因此,进食量“Food”的确对体重增量“Weight”具有影响,表明在比较不同喂养饲料对体重增量的影响时,应扣除进食量对体重增量的影响。

图 14
(3) 条件7判断(正态性检验)

图15为残差正态性检验结果,显示W=0.982,P=0.682>0.05,表明残差服从正态分布,满足条件7。

图 15
(4) 条件8判断(方差齐性检验)

图15为组间方差齐性检验结果,显示F=2.063,P=0.140>0.10,可以认为组间方差齐,满足条件8。

图16
(5) 条件9判断(平行性检验)

行性检验其本质是考察自变量与协变量的交互项是否具有统计学意义,如果有统计学意义,就说明各组间回归斜率不同;若自变量与协变量的交互项没有统计学意义,就说明各组间回归斜率相同。

图17为回归斜率齐性检验结果,显示F=0.186,P=0.831>0.05,可以认为三组线性回归系数之间的差异无统计学意义,即三条回归线平行,满足条件9。

图 17

3. 统计描述

图18为估计边际均值的结果,三种饲料组的体重增量的校正平均值和95%CI分别为64.65 (55.55~73.75) g、74.09 (65.04~83.14) g、63.35 (50.05~76.64) g。

图 18

4. 统计推断

由图14还可以得到,校正模型检验的F=141.703,P<0.001,可以认为拟合的模型有统计学意义。模型中不同饲料组“group”对应的检验结果为F=1.999,P=0.149>0.05,差异无统计学意义,可以认为在扣除进食量的影响后,尚不能认为不同饲料喂养和体重增量有关系。

图19为决定系数R2计算结果,该值越接近1,说明模型对资料的拟合程度越好。本例中R2=0.912,说明体重增量的变异的91.2%可以由不同喂养饲料和进食量来解释,说明该回归方程资料拟合程度较好。调整R2表示调整了协变量个数后的R2,可以更加稳健的反应回归方程资料拟合程度。

图19

5.事后检验(两两比较)

本案例中由于三组间整体比较差异无统计学意义,因此无需再进行事后两两比较。但本软件输出的结果中同时给出了组间两两比较结果(图20),该结果中提供了各组两两比较的平均值差异、研究误差、校正后的P值和95%CI。由图20可知,三组中任意两组比较的差异均无统计学意义(P>0.05),与前面的统计推断结果一致。

图 20

四、结论

本研究采用单因素协方差分析,判断在调整进食量后A、B、C三种饲料对小白鼠的增重效果是否有差别。

首先进行适用条件判断:

  • 通过统计分析和专业知识判断,数据不存在异常值
  • 通过回归系数检验,提示各组内协变量和因变量之间存在线性关系
  • 通过Shapiro-Wilk检验,提示该资料残差满足正态性
  • 通过Levene’s检验,提示各组因变量满足方差齐性要求
  • 通过回归斜率齐性检验,提示满足平行性检验要求

单因素协方差分析显示,在调整进食量后A、B、C三组体重增量的估算边际均值分别为64.65 (95%CI为55.55~73.75) g、74.09 (95%CI为 65.04~83.14) g、63.35 (95%CI为50.05~76.64) g,差异无统计学意义(F=1.999,P=0.149),为0.912,拟合程度很好。本研究结果提示A、B、C三种饲料对小白鼠体重的增重效果无差异。

五、分析小技巧

  • 协方差分析是针对在实验设计阶段难以控制其取值水平,或者无法严格控制的因素,在统计分析阶段对其进行统计控制的一种分析方法,实质为线性回归分析和方差分析的结合。适用于完全随机设计、随机区组(配伍)设计、拉丁方设计、析因设计等类型的方差分析。
  • 协方差分析一般要求协变量在组间的观察范围相差不宜太大(分析前最好先对协变量均数间的差别作假设检验),否则修正后的边际均值的差值可能会落在回归线的延长线上,此时回归线外推后是否仍然满足平行线和线性关系的条件尚不可知,其协方差分析的结论可能不一定准确。
  • 本案例如果不调整协变量“进食量”的影响(图8中“协变量”下不选择“Food”变量),直接采用单因素方差分析比较三种饲料的增重效果,将会得出差异有统计学意义的错误结论(感兴趣的读者请自行操作)。
End
文章目录 沉浸式阅读