关键词:Stata; 拉丁方设计; 方差分析; 仅研究主效应的实验设计
在医学研究中,随机区组设计涉及一个处理因素、一个区组因素;若实验研究涉及一个处理因素和两个区组因素,且每个因素的水平数相等,此时可采用拉丁方设计来安排实验,将两个区组因素分别安排在拉丁方设计的行和列上。需要注意的是,由于处理因素只有一个,因此此种设计仍为单因素设计实验。拉丁方设计是在随机区组设计的基础之上发展而来,可以多安排一个对实验结果有影响的非处理因素,增加了均衡性,减少了误差,提高了效率。
一、案例介绍
假设某研究者欲比较A、B、C、D、E、F 6种饲料(feed,A~F依次对应1~6)对大鼠的增重效果(weight, g)。采用拉丁方设计,选用6只体重相近的出窝雄性大鼠(row_block)并在每天固定的6个时间点(col_block)给大鼠喂养相同重量的饲料。试对该拉丁方设计的实验结果进行方差分析。部分数据见图1。本案例数据可从“附件下载”处下载。
二、问题分析
在拉丁方设计资料分析时采用三向分类的方差分析(three-way classification ANOVA)。总变异可分解为处理组变异、行区组变异、列区组变异和误差4部分,需要满足6个条件:
条件1:观察变量唯一,且为连续变量。本研究中观察变量为体重增量,为连续变量,该条件满足。
条件2:有3个因素,且都为分类变量。本研究中有处理效应(A~F6种饲料)及两个区组因素(大鼠编号、喂养时间),都为分类变量,该条件满足。
条件3:观测值相互独立。本研究中各研究对象的观测值都是独立的,不存在互相干扰的情况,该条件满足。
条件4:相互比较的各处理水平(组别)的总体方差相等,即方差齐同,可采用方差齐性检验。实际上,当各组样本含量相等或接近时,即使方差不齐,方差分析结果仍然稳健。该条件需要通过软件分析后判断。
条件5:各组、各水平观测值为正态(或近似正态)分布。该条件需要通过软件分析后判断。
条件6:观察变量不存在显著的异常值。该条件需要通过软件分析后判断。
三、软件操作及结果解读
(一) 导入数据
(二) 适用条件判断
条件4~6需要通过模型残差进行判断,因此先生成模型残差。
1. 生成模型残差(图2)
anova weight row_block col_block feed predict e, res
2. 条件4判断(方差齐性检验)
(1) 软件操作
绘制残差图,语句如下,结果见图3。
rvfplot, yline(0)
使用统计学推断检验方差齐性,语句如下,结果见图4。
anova e feed
(2) 结果解读
由残差图(图3)可见,残差均匀地分布在图形中,提示观察变量的残差满足方差齐性;残差的方差齐性检验结果(图4)显示,P=1.000,提示相互比较的各处理水平的总体方差相等。满足条件4。
3. 条件5判断(正态性检验)
(1) 软件操作
采用Shapiro-wilk检验对残差进行正态性检验,语句如下,结果见图5。
swilk e
(2) 结果解读
正态性检验结果(图5)显示,W=0.952,P=0.120>0.1,提示因变量残差整体服从正态分布。满足条件5。此外,也可以使用Q-Q图判断正态性(读者可自行操作)。
4. 条件6判断(异常值)
(1) 软件操作
绘制箱线图对残差进行异常值检测,语句如下,结果见图6。
Graph box e
(2) 结果解读
箱线图(图6)未提示任何异常值和极端值,满足条件6。
(三) 统计描述
1. 软件操作
bysort feed: summarize weight
2. 结果解读
图7列出了处理组各组的均值和标准差,可知A、B、C、D、E、F 6种饲料的大鼠体重增量分别为233.50±10.17、208.50±15.81、227.00±27.54、219.50±22.32、225.00±8.63、197.00±13.90 g。
(四) 三因素方差分析
1. 整体比较
anova weight row_block col_block feed
2. 结果解读
拉丁方设计的方差分析结果见图8。可知处理效应(不同饲料)之间的差异有统计学意义(F=3.80,P=0.014),两区组效应间差异均无统计学意义(均P>0.1)。
3.事后检验
采用Bonferroni法进行事后检验,语句见下,结果见图9。
pwcompare feed, mcompare(bonferroni) effects
进一步的两两比较分析结果见图9。可见,饲料A (233.50±10.17)与饲料F (197.00±13.90)相比,效应差异有统计学意义(t=-3.74,P=0.0190)。其余饲料之间的效应差异尚无统计学意义(P>0.05)。
四、结论
本研究采用拉丁方设计分析6种饲料对大鼠的增重效果。通过对残差进行统计学推断,提示6组饲料组数据间方差齐,整体服从正态分布,无异常值。
分析结果显示,A、B、C、D、E、F 6种饲料的大鼠体重增量分别为233.50±10.17、208.50±15.81、227.00±27.54、219.50±22.32、225.00±8.63、197.00±13.90 g。不同饲料喂养的大鼠体重增量差异不全相同(F=3.80,P=0.014)。通过事后检验两两比较发现,饲料A喂养大鼠体重增量高于饲料F喂养的大鼠,差异有统计学意义(t=-3.74,P=0.0190),其余饲料之间的差异尚无统计学意义。