关键词:R; 嵌套设计; 巢式设计; 窝设计; 系统分组设计; 一般线性模型; 方差分析
一、案例介绍
研究A、B、C三种催化剂在不同温度(temp)下对某化合物的转化作用[用转化率rate (%)表示]。将催化剂作为一级试验因素,温度作为二级试验因素,采用嵌套设计,每个处理重复两次(order),试验设计及结果见表1。试做方差分析。部分数据见表2,案例数据可从页面“附件下载”处下载。
表1 实验设计的因素与水平
实验批次 | A催化剂 | B催化剂 | C催化剂 | ||||||
70℃ | 80℃ | 90℃ | 55℃ | 65℃ | 75℃ | 90℃ | 95℃ | 100℃ | |
1 | 82 | 91 | 85 | 65 | 62 | 56 | 71 | 75 | 85 |
2 | 84 | 88 | 83 | 61 | 59 | 60 | 67 | 78 | 89 |
二、问题分析
本案例是嵌套设计的方差分析,可以按照多因素方差分析进行数据分析,应满足6个条件:
条件1:观察变量唯一,且为连续变量。本研究中观察变量只有转化率,为连续变量,该条件满足。
条件2:有多个因素,且都为分类变量。本研究中有2个因素,都为多水平的分类变量,该条件满足。
条件3:观测值相互独立。本研究中各研究对象的观测值是独立的,不存在互相干扰的情况,该条件满足。
条件4:各组、各水平观测值为正态(或近似正态)分布。
条件5:观察变量不存在显著的异常值。
嵌套设计非完全随机分组,因此不做方差齐性检验。
三、软件操作及结果解读
(一) 适用条件判断
嵌套设计中对异常值的判断一般根据专业知识确定,对正态性一般不做严格要求。如果要进行正态性检验,可参考拉丁方设计(Latin Square Design)资料的方差分析—R软件实现。
(二) 数据分析
1. 导入数据
mydata <- read.csv("嵌套设计.csv", header = T) View (mydata) str (mydata) mydata$catalyst = factor(mydata$catalyst, levels = c(1, 2, 3), labels = c("A催化剂", "B催化剂", "C催化剂")) mydata$temp <- as.factor(mydata$temp) mydata$order <- as.factor(mydata$order) str (mydata)
2.分组描述
library(psych) #调用包“psych” describeBy(rate ~ catalyst, data = mydata)
3.方差分析
result1 <- aov(rate ~ catalyst/factor(temp) + order, mydata) summary (result1)
result2 <- aov(rate ~ catalyst + Error (catalyst:temp), data = mydata) summary (result2)
4.两两比较
#以催化剂A为参照#
mydata$catalyst <- relevel(mydata$catalyst, ref = "A催化剂") blrfit1 <- lm(rate ~ catalyst + temp, data = mydata) summary (blrfit1)
#以催化剂B为参照#
mydata$catalyst <- relevel(mydata$catalyst, ref = "B催化剂") blrfit2 <- lm(rate ~ catalyst + temp, data = mydata) summary (blrfit2)
#以催化剂C为参照#
mydata$catalyst <- relevel(mydata$catalyst, ref = "C催化剂") blrfit3 <- lm(rate ~ catalyst + temp, data = mydata) summary (blrfit3)
(三) 结果解读
1. 统计描述/估算边际平均值
嵌套设计的“描述统计”结果如图2所示。A催化剂的转化率为85.50±3.39,B催化剂的转化率为60.50±3.02,C催化剂的转化率为77.50±8.34。
2. 方差分析
“主体间效应检验”结果(图3)提示,同一催化剂不同温度间的差异有统计学意义(F=10.912,P=0.002)。关于不同催化剂间差异是否统计学意义,需要以图4“定制假设检验”结果为准,可见F=14.63,P=0.005,可认为不同催化剂的转化率差异有统计学意义。
3. 多重比较
本研究采用嵌套设计研究A、B、C三种催化剂在不同温度下对某化合物的转化作用。分析结果显示,同一催化剂不同温度间的差异有统计学意义(F=12.15,P<0.001)。不同催化剂的转化率差异有统计学意义(F=14.63,P=0.005)。调整了催化剂组间不同温度影响后,三组间差异均有统计学意义(P<0.001)。A催化剂的转化率最高85.50±3.39,C催化剂其次77.50±8.34,B催化剂最低60.50±3.02。