随机区组设计(Randomized Block Design)资料的方差分析——SPSS软件实现

发布于 2023年1月7日 星期六 15:01:07 浏览:7388
原创不易,转载请注明来源,感谢!
附件下载:
随机区组设计(配伍设计)方差分析.zip 请勿重复点击,如无响应请耐心等待或稍后再试。

随机区组设计(Randomized Block Design)是医学科研中常用的研究设计方法,是配对设计的扩展,也称配伍设计,是研究主效应的实验设计类型之一。本文将实例演示在SPSS软件中通过一般线性模型模块实现随机区组设计资料的方差分析的操作步骤。

关键词:SPSS; 随机区组设计; 配伍设计; 一般线性模型; 事后检验; 两两比较

一、案例介绍

欲研究3种药物(drug,1=A 、2=B 、3=C)对贫血患儿的治疗效果。将24例贫血患儿按照贫血程度分成8个区组(block),每个区组的3例患儿分别随机接受A、B、C3种药物治疗。记录治疗30天后每名患儿血红蛋白(Hb)的增量(g/L)。部分数据见图1。本案例数据可从“附件下载”处下载。

图1

二、问题分析

本案例是随机区组设计的方差分析,可以按照两因素方差分析进行数据分析。但需要满足6个条件:

条件1:观察变量唯一,且为连续变量。本研究中观察变量只有血红蛋白的增量,且为连续变量,该条件满足。

条件2:有两个因素,且都为分类变量。本研究中有处理效应(药物)及区组(贫血程度)两个因素,都为分类变量,该条件满足。

条件3:观测值相互独立。本研究中各研究对象的观测值都是独立的,不存在互相干扰的情况,该条件满足。

条件4:观察变量不存在显著的异常值,该条件需要通过软件分析后判断。

条件5:相互比较的各处理水平(组别)的总体方差相等,即方差齐同,可采用方差齐性检验,该条件需要通过软件分析后判断。

条件6:各组、各水平观测值为正态(或近似正态)分布或因变量残差整体服从正态分布,该条件需要通过软件分析后判断。

三、软件操作及结果解读

(一) 适用条件判断

异常值检测及正态性检验、方差齐性检验,在一般线性模型或线性回归中可以通过残差进行判断,详见“两因素重复测量方差分析(Two-way ANOVA)一——无交互作用——SPSS软件实现(链接)”,异常值还可以通过库克距离进行判断。一般线性模型分析操作过程详见后文。

1. 条件4判断(异常值检测)

一般认为当库克距离(Cook′s distance)≤0.5时不是异常值点,>0.5时是异常值点。Coo_1是通过一般线性模型生成的库克距离(图2);可知,最大库克距离为0.36<0.5,提示不存在显著异常值。

图2

2. 条件5判断(正态性检测)

通过对一般线性模型生成的残差进行整体(不分组)正态性检验(图3),可知柯尔莫戈洛夫-斯米诺夫(K-S检验)和夏皮洛-威尔克正态性(S-W检验)两种正态性检验的结果,均提示数据服从正态分布(P>0.05)。

图3

3. 条件6判断(方差齐性检验)

在一般线性模型的一元方差分析中,如果有2个及以上的因素且无重复例数的时候,模型不会给出方差齐性检验的结果。此时可以通过对一般线性模型分析生成的残差进行统计学检验。操作如下:

选择“分析”—“比较平均值”—“单因素ANOVA检验(此处也可以使用独立样本t检验)”(图4)。

图4

打开“单因素ANOVA检验”对话框(图5),将“Hb的标准化残差”选入右侧“因变量列表”,将“药物”选入“因子”。

图5

通过残差的单因素方差分析结果(图6)可知,基于平均值的F<0.001,P=1.000,提示3组数据方差齐。

图6

(二) 一般线性模型分析过程

选择“分析”—“一般线性模型”—“单变量”(图7)。

图7

打开“单变量”对话框(图8),将Hb选入右侧“因变量”框,将drug、block选入右侧“固定因子”框。

图8

点击“单变量”对话框(图8)右侧“模型”,打开“单变量:模型”子对话框(图9),选中“构建项”,将drug和block的“主效应”选入右侧“模型”框中。注意,“指定模型”中不能选择“全因子”,因为不需要分析交互作用。

图9

点击“单变量”对话框(图8)右侧“图”,打开“单变量:轮廓图”子对话框(图10),将drug选入右侧“水平轴”,点击“添加”,可图形展示3组的数值水平;再将block选入右侧“水平轴”中,将drug选入右侧“单独的线条”中,然后点击“添加”,可分区组展示3组的数值情况;在“图表类型”中选“折线图”;在“误差条形图”勾选“包括误差条形图”及“置信区间(95.0%)”,点击“继续”。

图10

点击“单变量”对话框(图8)右侧“事后比较”,打开“单变量:实测平均值的事后多重比较”子对话框(图11),将drug、block选入右侧“下列各项的事后检验”框,在“假定等方差”项中勾选“邦弗伦尼”以进行两两比较,点击“继续”。

图11

点击“单变量”对话框(图8)右侧“EM平均值”,打开“单变量:估算边际均值”子对话框(图12),将drug、block选入右侧“显示下列各项的均值”框中,点击“继续”。注意,此处“比较主效应”可以不勾选,对于无协变量的分析,此处的多重比较等价于图11的事后多重比较,感兴趣的读者可自行操作。

图12

点击“单变量”对话框(图8)右侧“保存”,打开“单变量:保存”子对话框(图13),“残差”项中勾选“标准化”,“诊断”项中勾选“库克距离”,点击“继续”。

图13

点击“单变量”对话框(图8)右侧“选项”,打开“单变量:选项”子对话框(图14),“显示”项中勾选“描述统计”,点击“继续”。回到图8后,点击“确定”即可。

图14

(三) 结果解读

1. 统计描述

由图15可知,A、B、C药治疗后贫血患儿血红蛋白的平均增量分别为9.16±1.20、10.28±1.13、11.58±0.94 g/L。3组数值存在差异,但还需要依据统计学检验的结果进行判断。

图15

“血红蛋白增量的估算边际平均值”图(图16)绘制了各组血红蛋白增量的变化情况,可见3组数值存在差异。图17分区组展示了3组数值情况,数值变化显示得更清楚。

图16
图17

2. 估算边际平均值

当不存在协变量时,“估算边际平均值”(图18)和“统计描述”(图15)的均值一样。“估算边际平均值”同时给出了95%置信区间。

图18

3. 方差分析

“主体间效应检验”结果(图19)提示,Fblock=35.402,P<0.001,表示区组间均数差异有统计学意义,配伍有效;Fdrug=121.332,P<0.001,表明A、B、C3组均数不全相等(至少有两组均数不相同)。

图19

4. 多重比较

“多重比较”结果见图20,凡是“显著性”一栏,P<0.05,表示两者之间差异有统计学意义。由图中可知,A组和B组之间的差异为1.113 g/L,差异有统计学意义(P<0.001);A组和C组之间的差异为2.413 g/L,差异有统计学意义(P<0.001);B组和C组之间的差异为1.300 g/L,差异有统计学意义(P<0.001)。

图20

本案例如果采用单因素方差分析,其多重比较结果(图21)将会发现A、B之间以及B、C之间的差异均无统计学意义,也进一步证实了随机区组设计的有效性。

图21

四、结论

本研究采用随机区组设计分析A、B、C3种药物对贫血患儿的治疗效果。通过库克距离判断,3组数据不存在需要特殊处理的异常值;通过对残差进行正态性检验,提示数据服从正态分布;通过对残差进行统计学检验,提示3组数据间方差齐。

分析结果显示,A、B、C药治疗后贫血患儿血红蛋白的平均增量分别为9.16±1.20、10.28±1.13、11.58±0.94 (g/L),3组均数不全相等(F=121.332,P<0.001)。进一步采用邦弗伦尼法进行两两比较,显示A组和B组之间的差异为1.113 g/L,差异有统计学意义(P<0.001);A组和C组之间的差异为2.413 g/L,差异有统计学意义(P<0.001);B组和C组之间的差异为1.300 g/L,差异有统计学意义(P<0.001)。即C药的效果优于A药和B药,B药的效果优于A药。

End
文章目录 沉浸式阅读