拉丁方设计方差分析(Latin Square Design ANOVA)——Stata软件实现

发布于 2023年1月4日 星期三 15:28:23 浏览:1295
原创不易,转载请注明来源,感谢!
附件下载:
拉丁方设计方差分析.zip 请勿重复点击,如无响应请耐心等待或稍后再试。

在前面文章中介绍了随机区组设计方差分析(Randomized Block Design ANOVA)——Stata软件实现(链接)和两阶段交叉设计方差分析(Two-stage Cross-over Design ANOVA)——Stata软件实现,本文进一步介绍仅研究主效应的实验设计中的拉丁方设计方差分析(Latin Square Design ANOVA)在Stata软件中的实现步骤。

关键词:Stata; 拉丁方设计; 方差分析; 仅研究主效应的实验设计

在医学研究中,随机区组设计涉及一个处理因素、一个区组因素;若实验研究涉及一个处理因素和两个区组因素,且每个因素的水平数相等,此时可采用拉丁方设计来安排实验,将两个区组因素分别安排在拉丁方设计的行和列上。需要注意的是,由于处理因素只有一个,因此此种设计仍为单因素设计实验。拉丁方设计是在随机区组设计的基础之上发展而来,可以多安排一个对实验结果有影响的非处理因素,增加了均衡性,减少了误差,提高了效率。

一、案例介绍

假设某研究者欲比较A、B、C、D、E、F 6种饲料(feed,A~F依次对应1~6)对大鼠的增重效果(weight, g)。采用拉丁方设计,选用6只体重相近的出窝雄性大鼠(row_block)并在每天固定的6个时间点(col_block)给大鼠喂养相同重量的饲料。试对该拉丁方设计的实验结果进行方差分析。部分数据见图1。本案例数据可从“附件下载”处下载。

图1

二、问题分析

在拉丁方设计资料分析时采用三向分类的方差分析(three-way classification ANOVA)。总变异可分解为处理组变异、行区组变异、列区组变异和误差4部分,需要满足6个条件:

条件1:观察变量唯一,且为连续变量。本研究中观察变量为体重增量,为连续变量,该条件满足。

条件2:有3个因素,且都为分类变量。本研究中有处理效应(A~F6种饲料)及两个区组因素(大鼠编号、喂养时间),都为分类变量,该条件满足。

条件3:观测值相互独立。本研究中各研究对象的观测值都是独立的,不存在互相干扰的情况,该条件满足。

条件4:相互比较的各处理水平(组别)的总体方差相等,即方差齐同,可采用方差齐性检验。实际上,当各组样本含量相等或接近时,即使方差不齐,方差分析结果仍然稳健。该条件需要通过软件分析后判断。

条件5:各组、各水平观测值为正态(或近似正态)分布。该条件需要通过软件分析后判断。

条件6:观察变量不存在显著的异常值。该条件需要通过软件分析后判断。

三、软件操作及结果解读

(一) 导入数据

详见Stata数据的读取及结果保存

(二) 适用条件判断

条件4~6需要通过模型残差进行判断,因此先生成模型残差。

1. 生成模型残差(图2)

anova weight row_block col_block feed
predict e, res
图2

2. 条件4判断(方差齐性检验)

(1) 软件操作

绘制残差图,语句如下,结果见图3。

rvfplot, yline(0)

使用统计学推断检验方差齐性,语句如下,结果见图4。

anova e feed
(2) 结果解读

由残差图(图3)可见,残差均匀地分布在图形中,提示观察变量的残差满足方差齐性;残差的方差齐性检验结果(图4)显示,P=1.000,提示相互比较的各处理水平的总体方差相等。满足条件4。

图3
图4

3. 条件5判断(正态性检验)

(1) 软件操作

采用Shapiro-wilk检验对残差进行正态性检验,语句如下,结果见图5。

swilk e
(2) 结果解读

正态性检验结果(图5)显示,W=0.952,P=0.120>0.1,提示因变量残差整体服从正态分布。满足条件5。此外,也可以使用Q-Q图判断正态性(读者可自行操作)。

图5

4. 条件6判断(异常值)

(1) 软件操作

绘制箱线图对残差进行异常值检测,语句如下,结果见图6。

Graph box e
(2) 结果解读

箱线图(图6)未提示任何异常值和极端值,满足条件6。

图6

(三) 统计描述

1. 软件操作

bysort feed: summarize weight

2. 结果解读

图7列出了处理组各组的均值和标准差,可知A、B、C、D、E、F 6种饲料的大鼠体重增量分别为233.50±10.17、208.50±15.81、227.00±27.54、219.50±22.32、225.00±8.63、197.00±13.90 g。

图7

(四) 三因素方差分析

1. 整体比较

anova weight row_block col_block feed

2. 结果解读

拉丁方设计的方差分析结果见图8。可知处理效应(不同饲料)之间的差异有统计学意义(F=3.80,P=0.014),两区组效应间差异均无统计学意义(均P>0.1)。

图8

3.事后检验

采用Bonferroni法进行事后检验,语句见下,结果见图9。

pwcompare feed, mcompare(bonferroni) effects

进一步的两两比较分析结果见图9。可见,饲料A (233.50±10.17)与饲料F (197.00±13.90)相比,效应差异有统计学意义(t=-3.74,P=0.0190)。其余饲料之间的效应差异尚无统计学意义(P>0.05)。

图9

四、结论

本研究采用拉丁方设计分析6种饲料对大鼠的增重效果。通过对残差进行统计学推断,提示6组饲料组数据间方差齐,整体服从正态分布,无异常值。

分析结果显示,A、B、C、D、E、F 6种饲料的大鼠体重增量分别为233.50±10.17、208.50±15.81、227.00±27.54、219.50±22.32、225.00±8.63、197.00±13.90 g。不同饲料喂养的大鼠体重增量差异不全相同(F=3.80,P=0.014)。通过事后检验两两比较发现,饲料A喂养大鼠体重增量高于饲料F喂养的大鼠,差异有统计学意义(t=-3.74,P=0.0190),其余饲料之间的差异尚无统计学意义。

End
文章目录 沉浸式阅读