关键词:SPSS; 随机区组设计; 配伍设计; 一般线性模型; 事后检验; 两两比较
一、案例介绍
欲研究3种药物(drug,1=A 、2=B 、3=C)对贫血患儿的治疗效果。将24例贫血患儿按照贫血程度分成8个区组(block),每个区组的3例患儿分别随机接受A、B、C3种药物治疗。记录治疗30天后每名患儿血红蛋白(Hb)的增量(g/L)。部分数据见图1。本案例数据可从“附件下载”处下载。
二、问题分析
本案例是随机区组设计的方差分析,可以按照两因素方差分析进行数据分析。但需要满足6个条件:
条件1:观察变量唯一,且为连续变量。本研究中观察变量只有血红蛋白的增量,且为连续变量,该条件满足。
条件2:有两个因素,且都为分类变量。本研究中有处理效应(药物)及区组(贫血程度)两个因素,都为分类变量,该条件满足。
条件3:观测值相互独立。本研究中各研究对象的观测值都是独立的,不存在互相干扰的情况,该条件满足。
条件4:观察变量不存在显著的异常值,该条件需要通过软件分析后判断。
条件5:相互比较的各处理水平(组别)的总体方差相等,即方差齐同,可采用方差齐性检验,该条件需要通过软件分析后判断。
条件6:各组、各水平观测值为正态(或近似正态)分布或因变量残差整体服从正态分布,该条件需要通过软件分析后判断。
三、软件操作及结果解读
(一) 适用条件判断
异常值检测及正态性检验、方差齐性检验,在一般线性模型或线性回归中可以通过残差进行判断,详见“两因素重复测量方差分析(Two-way ANOVA)一——无交互作用——SPSS软件实现(链接)”,异常值还可以通过库克距离进行判断。一般线性模型分析操作过程详见后文。
1. 条件4判断(异常值检测)
一般认为当库克距离(Cook′s distance)≤0.5时不是异常值点,>0.5时是异常值点。Coo_1是通过一般线性模型生成的库克距离(图2);可知,最大库克距离为0.36<0.5,提示不存在显著异常值。
2. 条件5判断(正态性检测)
通过对一般线性模型生成的残差进行整体(不分组)正态性检验(图3),可知柯尔莫戈洛夫-斯米诺夫(K-S检验)和夏皮洛-威尔克正态性(S-W检验)两种正态性检验的结果,均提示数据服从正态分布(P>0.05)。
3. 条件6判断(方差齐性检验)
在一般线性模型的一元方差分析中,如果有2个及以上的因素且无重复例数的时候,模型不会给出方差齐性检验的结果。此时可以通过对一般线性模型分析生成的残差进行统计学检验。操作如下:
选择“分析”—“比较平均值”—“单因素ANOVA检验(此处也可以使用独立样本t检验)”(图4)。
打开“单因素ANOVA检验”对话框(图5),将“Hb的标准化残差”选入右侧“因变量列表”,将“药物”选入“因子”。
通过残差的单因素方差分析结果(图6)可知,基于平均值的F<0.001,P=1.000,提示3组数据方差齐。
(二) 一般线性模型分析过程
选择“分析”—“一般线性模型”—“单变量”(图7)。
打开“单变量”对话框(图8),将Hb选入右侧“因变量”框,将drug、block选入右侧“固定因子”框。
点击“单变量”对话框(图8)右侧“模型”,打开“单变量:模型”子对话框(图9),选中“构建项”,将drug和block的“主效应”选入右侧“模型”框中。注意,“指定模型”中不能选择“全因子”,因为不需要分析交互作用。
点击“单变量”对话框(图8)右侧“图”,打开“单变量:轮廓图”子对话框(图10),将drug选入右侧“水平轴”,点击“添加”,可图形展示3组的数值水平;再将block选入右侧“水平轴”中,将drug选入右侧“单独的线条”中,然后点击“添加”,可分区组展示3组的数值情况;在“图表类型”中选“折线图”;在“误差条形图”勾选“包括误差条形图”及“置信区间(95.0%)”,点击“继续”。
点击“单变量”对话框(图8)右侧“事后比较”,打开“单变量:实测平均值的事后多重比较”子对话框(图11),将drug、block选入右侧“下列各项的事后检验”框,在“假定等方差”项中勾选“邦弗伦尼”以进行两两比较,点击“继续”。
点击“单变量”对话框(图8)右侧“EM平均值”,打开“单变量:估算边际均值”子对话框(图12),将drug、block选入右侧“显示下列各项的均值”框中,点击“继续”。注意,此处“比较主效应”可以不勾选,对于无协变量的分析,此处的多重比较等价于图11的事后多重比较,感兴趣的读者可自行操作。
点击“单变量”对话框(图8)右侧“保存”,打开“单变量:保存”子对话框(图13),“残差”项中勾选“标准化”,“诊断”项中勾选“库克距离”,点击“继续”。
点击“单变量”对话框(图8)右侧“选项”,打开“单变量:选项”子对话框(图14),“显示”项中勾选“描述统计”,点击“继续”。回到图8后,点击“确定”即可。
(三) 结果解读
1. 统计描述
由图15可知,A、B、C药治疗后贫血患儿血红蛋白的平均增量分别为9.16±1.20、10.28±1.13、11.58±0.94 g/L。3组数值存在差异,但还需要依据统计学检验的结果进行判断。
“血红蛋白增量的估算边际平均值”图(图16)绘制了各组血红蛋白增量的变化情况,可见3组数值存在差异。图17分区组展示了3组数值情况,数值变化显示得更清楚。
2. 估算边际平均值
当不存在协变量时,“估算边际平均值”(图18)和“统计描述”(图15)的均值一样。“估算边际平均值”同时给出了95%置信区间。
3. 方差分析
“主体间效应检验”结果(图19)提示,Fblock=35.402,P<0.001,表示区组间均数差异有统计学意义,配伍有效;Fdrug=121.332,P<0.001,表明A、B、C3组均数不全相等(至少有两组均数不相同)。
4. 多重比较
“多重比较”结果见图20,凡是“显著性”一栏,P<0.05,表示两者之间差异有统计学意义。由图中可知,A组和B组之间的差异为1.113 g/L,差异有统计学意义(P<0.001);A组和C组之间的差异为2.413 g/L,差异有统计学意义(P<0.001);B组和C组之间的差异为1.300 g/L,差异有统计学意义(P<0.001)。
本案例如果采用单因素方差分析,其多重比较结果(图21)将会发现A、B之间以及B、C之间的差异均无统计学意义,也进一步证实了随机区组设计的有效性。
四、结论
本研究采用随机区组设计分析A、B、C3种药物对贫血患儿的治疗效果。通过库克距离判断,3组数据不存在需要特殊处理的异常值;通过对残差进行正态性检验,提示数据服从正态分布;通过对残差进行统计学检验,提示3组数据间方差齐。
分析结果显示,A、B、C药治疗后贫血患儿血红蛋白的平均增量分别为9.16±1.20、10.28±1.13、11.58±0.94 (g/L),3组均数不全相等(F=121.332,P<0.001)。进一步采用邦弗伦尼法进行两两比较,显示A组和B组之间的差异为1.113 g/L,差异有统计学意义(P<0.001);A组和C组之间的差异为2.413 g/L,差异有统计学意义(P<0.001);B组和C组之间的差异为1.300 g/L,差异有统计学意义(P<0.001)。即C药的效果优于A药和B药,B药的效果优于A药。