关键词:jamovi; 重复测量; 重复测量资料; 重复测量方差分析; 单因素重复测量方差分析; 球形检验; 交互作用; 主效应; 单独效应
一、案例介绍
检验科研究血样放置时间对某生化指标浓度检测的影响,采集了10份人血标本,分别在放置0分钟、30分钟、60分钟和90分钟时对该指标的浓度(mmol/L)进行检测,分析放置时间是否对该生化指标检测结果有影响?对数据的变量进行标签赋值后部分数据见图1。本文案例可从“附件下载”处下载。
二、问题分析
本案例的分析目的是比较四个时间点的生化指标浓度是否有差异。由于4个时间点的数据属于重复测量数据,可以使用单因素重复测量方差分析。但需要满足4个条件:
条件1:观察变量唯一,且为连续变量。本研究中观察变量为生化指标浓度,且为连续变量,该条件满足。
条件2:观察变量为重复测量数据,即不满足独立性。本研究中4个时间点测量的生化指标浓度均是针对同一批样本,因此不满足独立性,该条件满足。
条件3:观察变量不存在显著的异常值,该条件需要通过软件分析后判断。
条件4:各水平(时间点)观察变量为正态(或近似正态)分布,该条件需要通过软件分析后判断。
三、软件操作及结果解读
(一) 适用条件判断
1. 条件3判断(异常值判断)
(1) 软件操作
① 选择“分析”—“探索”—“描述”,将观察变量“0分钟、30分钟、60分钟、90分钟”选入右侧“变量”框(图2)。
② 在“统计”下的“样本量”中勾选“个案数”、“缺失值”,在“集中趋势”中勾选“均值”、“中位数”,在“离散”中勾选“标准差”、“最小值”和“最大值”(图3),结果如表1所示。
③ 在“绘图”下的“箱线图”中勾选“箱线图”和“数据”,“数据”下拉菜单中选择“散点”(图4),结果如图5-1—图5-4所示。
(2) 结果解读
表1“描述”表格中,列出了各组观察变量的最小值和最大值,依据专业尚不能认为存在异常值的情况;此外,图5-1—图5-4中的箱线图也未提示任何异常值。综上,本案例未发现需要处理的异常值,满足条件3。
2. 条件4判断(正态性检验)
(1) 软件操作
单因素重复测量方差分析时,需要分别考察每一组的正态性情况。
① 在“探索”—“描述”框中,将“0分钟、30分钟、60分钟、90分钟”选入右侧“变量”框(图2)。
② 在“统计”中勾选“Shapiro-Wilk检验”(图6),结果如表2所示。
(2) 结果解读
表2的正态性检验结果显示各时间点的P值为0.327、0.323、0.633、0.972,均>0.1,提示四组数据服从正态分布。此外,本案例也可以绘制Q-Q图,结果也提示四组数据服从正态分布(请读者自行操作)。综上,本案例满足条件4。
(二) 球形假设检验
1. 软件操作
① 选择“分析”—“方差分析”—“重复测量方差分析”(图7)。
② 在图8界面中,将“重复测量因子1”更改为“时间”;将“水平 1”改为“0分钟”,“水平 2”改为“30分钟”,“水平 3”改为“60分钟”,“水平 4”改为“90分钟”;然后将左侧0分钟、30分钟、60分钟、90分钟分别选入“重复测量单元”,如图9所示。
③ 在“适用条件判断”中勾选“球形度检验”(图10),结果如表3所示。
2. 结果解读
由表3的“球形度检验”结果可知,W=0.252,P=0.061,表示满足球形假设。因此,本案例可以直接采用非校正方法分析的结果。
(三) 统计描述
1. 软件操作
在“边际估计均值”中将“时间”选入右侧“边际均值”框,在“输出”下勾选“边际均值图”和“边际均值表”(图11),结果如图12和表4所示。
2. 结果解读
表1列出了0分钟、30分钟、60分钟、90分钟时间点的均值分别为(5.656±0.312)、(5.548±0.339)、(5.269±0.233)、(4.868±0.226)mmol/L。表4的“边际估计均值-时间”表格中提供了四个时刻的估算边际均值(偏最小二乘均值)、标准误及均值的95%CI。图12估算边际均值图绘制了四个时间点该生化指标浓度的变化情况,可见随着放置时间的延长,浓度逐渐降低。
(四) 统计学推断
1. 软件操作
由于本案例满足球形假设,因此以非校正分析结果为判断标准,在“适用条件判断”中勾选“无”、“Greenhouse-Geisser”和“Huynh-Feldt”;在“效应量”中勾选“普通Ƞ² 值”、“Ƞ² 值”、“偏 Ƞ² 值”(图13),结果如表5所示。
2. 结果解读
表5“组内效应”分析结果显示,非校正法分析自由度为3,均方为3.709,F=116.103,P<0.001;提示不同时间点该生化指标浓度差异有统计学意义。Ƞ²p为0.928,为高效应(图12)。
(五) 事后检验(两两比较)
上面分析得出了“不同时间点生化指标浓度差异有统计学意义”的结论,但是到底是哪些组别之间存在差异尚不清楚,因此需要进行事后检验,开展两两比较。
1. 软件操作
在“事后检验”框中按照图14勾选相应选项。本案例选择“Bonferroni 法”,“未校正”为输出未校正的P值。
2. 结果解读
表6 “事后比较-时间”表格中提供了各时间点两两比较的“均值差”、“标准误”、“自由度”、“t值”、“P值”和“Pbonferroni (校正P值)”。可知,随着时间的延长,各时刻与0分钟时刻相比,均值差逐渐增大,且均有统计学意义(P<0.05)。
四、结论
本研究采用单因素重复测量方差分析判断四个时间点的生化指标浓度是否有差异。通过专业知识判断,数据不存在异常值;通过Shapiro-Wilk检验,提示各组数据服从正态分布;球形度检验提示满足球形假设(W=0.252,P=0.061),使用未校正法进行数据分析。
0分钟、30分钟、60分钟、90分钟时间点的生化指标浓度均值分别为(5.656±0.312)、(5.548±0.339)、(5.269±0.233)、(4.868±0.226)mmol/L。分析提示,不同时间点生化指标浓度差异有统计学意义(F=116.103,P<0.001)。Ƞ²p为0.928,为大效应。进一步采用“Bonferroni”校正法进行两两比较,可知随着时间的延长,各时刻与0分钟时刻相比,均值差逐渐增大,且均有统计学意义(P<0.05)。综上可知,放置时间对该生化指标检测结果具有较大的影响。
五、知识小贴士
- 重复测量设计常见于同一组研究对象多次、多个部位或多个维度测量数据间的比较,包括时间重复测量、部位重复测量和维度重复测量。时间重复测量,如同一组患者用药前、用药后多个时间点某指标的比较;部位重复测量,如相同研究对象,身体多个部位某指标(如皮质厚度)的比较;维度重复测量,如使用某量表测量同一批研究对象不同生理或心理状态,其不同状态维度之间的比较(如生活质量SF-36各个维度之间的比较)。
- 球形度检验的目的是为了判断重复测量数据之间是否存在关联,如果P<0.05表明资料服从球形假设,说明重复测量数据之间实际上不存在相关性或相关性太弱,未被检测出来。此时以一元分析结果(主体内对比效应)的未校正模型为准。
- 当违背了球形假设条件时,需要进行epsilon (ε)校正。jamovi提供了Greenhouse-Geisser和Huynh-Feldt两种校正方法,epsilon (ε)值越小,说明违反球形假设的程度越高,当epsilon (ε)=1时,完全服从球形假设。当Greenhouse-Geisserepsilonε<0.75时,使用Greenhouse-Geisser方法校正;当Greenhouse-Geisserepsilonε>0.75时,使用Huynh-Feldt方法校正。