关键词:Stata; 随机区组设计; 方差分析; 仅研究主效应的实验设计
随机区组设计是配对设计的扩展。其具体做法是先按影响实验结果的非处理因素(如性别、年龄、体重、病情程度等)将实验对象配成区组(block),再分别将各区组内的实验对象随机分配到各处理组。若将区组视为一种处理因素的不同水平,则随机区组设计等同于两因素设计。
一、案例介绍
欲研究A (drug=1)、B (drug=2)、C (drug=3)3种药物(drug)对贫血患儿的治疗效果。将24例贫血患儿按照贫血程度分成8个区组(block),每个区组的3名患儿分别随机接受A、B、C3种药物治疗。记录治疗30天后每名患儿血红蛋白(Hb)的增量(g/L)。部分数据见图1。本案例数据可从“附件下载”处下载。
二、问题分析
本案例是随机区组设计的方差分析,可以按照两因素方差分析进行数据分析。但需要满足6个条件:
条件1:观察变量唯一,且为连续变量。本研究中观察变量只有血红蛋白的增量,且为连续变量,该条件满足。
条件2:有两个因素,且都为分类变量。本研究中有处理效应(药物)及区组(贫血程度)两个因素,都为分类变量,该条件满足。
条件3:观测值相互独立。本研究中各研究对象的观测值都是独立的,不存在互相干扰的情况,该条件满足。
条件4:相互比较的各处理水平(组别)的总体方差相等,即方差齐同,可采用方差齐性检验。该条件需要通过软件分析后判断。
条件5:各组、各水平观测值为正态(或近似正态)分布或因变量残差整体服从正态分布,该条件需要通过软件分析后判断。
条件6:观察变量不存在显著的异常值,该条件需要通过软件分析后判断。
三、软件操作及结果解读
(一)导入数据
(二) 适用条件判断
条件4~6需要通过模型残差进行判断,因此先生成模型残差。
1.生成模型残差
anova Hb drug block predict e, res
图2中e为生成的模型残差
2. 条件4判断(方差齐性检验)
(1) 软件操作
绘制残差图,语句如下,结果见图3。
rvfplot, yline(0)
使用统计学推断检验方差齐性,语句如下,结果见图4。
anova e drug
(2)结果解读
残差图见图3,可知残差均匀地分布在均值的上下两侧,提示观察变量的残差满足方差齐性。残差的方差齐性检验结果见图4显示,F<0.01、P=1.000>0.1,不能拒绝方差相等的原假设,提示观察变量的残差满足方差齐性。满足条件4。
3. 条件5判断(正态性检验)
(1) 软件操作
采用Shapiro-wilk检验对残差进行正态性检验,语句如下,结果见图5。
swilk e
(2) 结果解读
正态性检验结果见图5,显示W=0.9822,P=0.9325>0.05,提示因变量残差服从正态分布。满足条件5。
4. 条件6判断(异常值检测)
(1) 软件操作
graph box e
(2) 结果解读
残差的箱线图见图6,未提示任何异常值和极端值,满足条件6。
(三) 统计描述
1. 软件操作
bysort drug: summarize Hb
2. 结果解读
处理组各组的均数和标准差见图7,可知经A、B、C药治疗后贫血患儿血红蛋白的平均增量分别为9.16±1.20、10.28±1.13、11.58±0.94 g/L。
(四) 两因素方差分析
1. 整体比较
anova Hb drug block
随机区组设计的方差分析结果见图8,可知区组因素间与处理因素间的差异均有统计学意义(P<0.001)。
2. 事后检验
pwcompare drug, mcompare(bonferroni) effects
“多重比较”结果见图9,可知以药物A为参照,药物B的疗效平均比药物A高1.113 g/L,药物C的疗效平均比药物A高2.413 g/L,差异均有统计学意义(P<0.001)。若以药物B为参照,药物C的疗效平均比药物B高1.300 g/L,药物A和药物C疗效比较结果同前,差异均有统计学意义(P<0.001)。
四、结论
本案例基于Stata软件实现随机区组设计的方差分析。案例欲研究A、B、C 3种药物对贫血患儿的治疗效果,采用随机区组设计。经A、B、C药治疗后贫血患儿血红蛋白的平均增量分别为9.16±1.20、10.28±1.13、11.58±0.94 g/L。区组因素间与处理因素间的差异均有统计学意义(P<0.001)。药物B的疗效平均比药物A高1.112g/L,药物C的疗效平均比药物A高2.412g/L,药物C的疗效平均比药物B高1.300 g/L,差异均有统计学意义(P<0.001)。