随机区组设计(Randomized Block Design)资料的方差分析—Stata软件实现

发布于 2023年2月25日 星期六 15:04:05 浏览:1153
原创不易,转载请注明来源,感谢!
附件下载:
随机区组设计.zip 请勿重复点击,如无响应请耐心等待或稍后再试。

随机区组设计(Randomized Block Design)是医学科研中常用的研究设计方法,本文实例介绍随机区组设计资料的方差分析在Stata软件中的实现步骤。

关键词:Stata; 随机区组设计; 方差分析; 仅研究主效应的实验设计

随机区组设计是配对设计的扩展。其具体做法是先按影响实验结果的非处理因素(如性别、年龄、体重、病情程度等)将实验对象配成区组(block),再分别将各区组内的实验对象随机分配到各处理组。若将区组视为一种处理因素的不同水平,则随机区组设计等同于两因素设计。

一、案例介绍

欲研究A (drug=1)、B (drug=2)、C (drug=3)3种药物(drug)对贫血患儿的治疗效果。将24例贫血患儿按照贫血程度分成8个区组(block),每个区组的3名患儿分别随机接受A、B、C3种药物治疗。记录治疗30天后每名患儿血红蛋白(Hb)的增量(g/L)。部分数据见图1。本案例数据可从“附件下载”处下载。

图1

二、问题分析

本案例是随机区组设计的方差分析,可以按照两因素方差分析进行数据分析。但需要满足6个条件:

条件1:观察变量唯一,且为连续变量。本研究中观察变量只有血红蛋白的增量,且为连续变量,该条件满足。

条件2:有两个因素,且都为分类变量。本研究中有处理效应(药物)及区组(贫血程度)两个因素,都为分类变量,该条件满足。

条件3:观测值相互独立。本研究中各研究对象的观测值都是独立的,不存在互相干扰的情况,该条件满足。

条件4:相互比较的各处理水平(组别)的总体方差相等,即方差齐同,可采用方差齐性检验。该条件需要通过软件分析后判断。

条件5:各组、各水平观测值为正态(或近似正态)分布或因变量残差整体服从正态分布,该条件需要通过软件分析后判断。

条件6:观察变量不存在显著的异常值,该条件需要通过软件分析后判断。

三、软件操作及结果解读

(一)导入数据

详见Stata数据的读取及结果保存

(二) 适用条件判断

条件4~6需要通过模型残差进行判断,因此先生成模型残差。

1.生成模型残差

anova Hb drug block
predict e, res

图2中e为生成的模型残差

图2

2. 条件4判断(方差齐性检验)

(1) 软件操作

绘制残差图,语句如下,结果见图3。

rvfplot, yline(0)

使用统计学推断检验方差齐性,语句如下,结果见图4。

anova e drug
(2)结果解读

残差图见图3,可知残差均匀地分布在均值的上下两侧,提示观察变量的残差满足方差齐性。残差的方差齐性检验结果见图4显示,F<0.01、P=1.000>0.1,不能拒绝方差相等的原假设,提示观察变量的残差满足方差齐性。满足条件4。

图3
图4

3. 条件5判断(正态性检验)

(1) 软件操作

采用Shapiro-wilk检验对残差进行正态性检验,语句如下,结果见图5。

swilk e
(2) 结果解读

正态性检验结果见图5,显示W=0.9822,P=0.9325>0.05,提示因变量残差服从正态分布。满足条件5。

图5

4. 条件6判断(异常值检测)

(1) 软件操作
graph box e
(2) 结果解读

残差的箱线图见图6,未提示任何异常值和极端值,满足条件6。

图6

(三) 统计描述

1. 软件操作

bysort drug: summarize Hb

2. 结果解读

处理组各组的均数和标准差见图7,可知经A、B、C药治疗后贫血患儿血红蛋白的平均增量分别为9.16±1.20、10.28±1.13、11.58±0.94 g/L。

图7

(四) 两因素方差分析

1. 整体比较

anova Hb drug block
图8

随机区组设计的方差分析结果见图8,可知区组因素间与处理因素间的差异均有统计学意义(P<0.001)。

2. 事后检验

pwcompare drug, mcompare(bonferroni) effects
图9

“多重比较”结果见图9,可知以药物A为参照,药物B的疗效平均比药物A高1.113 g/L,药物C的疗效平均比药物A高2.413 g/L,差异均有统计学意义(P<0.001)。若以药物B为参照,药物C的疗效平均比药物B高1.300 g/L,药物A和药物C疗效比较结果同前,差异均有统计学意义(P<0.001)。

四、结论

本案例基于Stata软件实现随机区组设计的方差分析。案例欲研究A、B、C 3种药物对贫血患儿的治疗效果,采用随机区组设计。经A、B、C药治疗后贫血患儿血红蛋白的平均增量分别为9.16±1.20、10.28±1.13、11.58±0.94 g/L。区组因素间与处理因素间的差异均有统计学意义(P<0.001)。药物B的疗效平均比药物A高1.112g/L,药物C的疗效平均比药物A高2.412g/L,药物C的疗效平均比药物B高1.300 g/L,差异均有统计学意义(P<0.001)。

End
文章目录 沉浸式阅读