关键词:MedCalc; t检验; 配对样本t检验; 配对t检验; 成对t检验;关联样本t检验; 差值正态性
一、案例介绍
为检测肌肉组织中某生化指标(X)的含量,分别使用A、B两种方法检测17只小白鼠肌肉组织中该生化指标(X)的含量,试问两种方法检测的结果是否有差异。部分数据见图1。本文案例数据可从“附件下载”处下载。
二、问题分析
本案例的分析目的是比较两种检测方法对同一批样本检测的结果是否存在差异,由于检测的指标是计量资料,因此可以使用配对样本t检验。但需要满足5个条件:
条件1:观察变量为连续变量。本研究中的生化指标(X)含量为连续变量,该条件满足。
条件2:观察变量为配对设计。本研究中,两组数据均是对同一批研究对象测量所得,因此属于配对样本。该条件满足。
条件3:观察变量可分为2组。本研究中分为A方法和B方法两组,该条件满足。
条件4:观察变量不存在显著的异常值。该条件需要通过软件分析后判断。
条件5:两个配对组别间观察变量的差值服从正态(或近似正态)分布。该条件需要通过软件分析后判断。
三、软件操作及结果解读
(一) 适用条件判断
对于本案例数据,条件1、2、3均满足。下面判断条件4、5。
1. 条件4判断(异常值判断)
(1) 软件操作
选择“统计”—“异常值检测”(图2),打开“异常值检测”对话框,分别检测A组和B组中是否存在异常值。
在“异常值检测”对话框(图3),“变量”下选择变量“A”;“异常值检测方法”下勾选“Grubbs-两侧”、“生成的ESD检验”(“检验最大量的异常值”中输入10)、“Tukey”。
在“异常值检测”对话框(图4),“变量”下选择变量“B”;“异常值检测方法”下勾选“Grubbs-两侧”、“生成的ESD检验”(“检验最大量的异常值”中输入10)、“Tukey”。
(2) 结果解读
图5为A组异常值检测结果,提示无异常值。
点击图5右下角的“盒形图”,出现“盒形图”对话框(图6),“变量”下选择“A”,“选项”中勾选“标绘所有数据”,图表方向选择“垂直”。可得到A组的盒形图(图7),也提示无异常值。
参照上述操作可得到B组的异常值检测结果(图8、图9),结果也提示无异常值。
2. 条件5判断(正态性检验)
配对样本t检验时,需要考察两个配对组之间观测变量差值的正态性情况。可以先计算配对组别观察变量的差值,再检测差值的正态性,也可以使用“成对样本t检验”分析过程中自带的正态性检验结果,两种方法完全一致;此处采用后者,详见下文。
(二) 统计描述及推断
1. 软件操作
选择“统计”—“T检验”—“成对样本T检验” (图10),打开“成对样本T检验”对话框。
在“成对样本T检验”对话框,”采样1”下选择“A”,采样2”下选择“B”,“置信区间%”下选“95”,“检验正态分布”下选择“Shapiro-Wilk检验 (夏皮罗-威尔克正态性检验,S-W检验)”。见图11。
2. 结果解读
(1) 条件5补充判断(正态性检验)
图12为两组数据差值的Shapiro-Wilk检验 (夏皮罗-威尔克正态性,S-W检验)结果,可知W=0.9332,P=0.2461,提示满足正态性。此处,也可以点击图12右下角“储存差异”,得到两组数据的差值,再对差值进行正态性检验,结果和图12完全一致,感兴趣的读者可自行操作。
(2) 统计描述
图13为统计描述结果,可知A组生化指标(X)平均值和标准差为0.3411±0.03458,B组生化指标(X)平均值和标准差为0.3048±0.02311。点击图12右下角的“点线图”可以进入“多重变量图表”对话框(图14),点击确定可得到两组数据的点状图和线状图(图15)。从均值看两组的生化指标含量可能存在差异,但还需要依据统计学检验的结果进行判断。
(3) 统计推断
图16为成对样本t检验的分析结果。可知,B组的生化指标平均值比A组的生化指标的平均值低0.03626,95%CI为-0.04711~-0.02541,差异有统计学意义(t=-7.085,P<0.0001),可根据需要保留相应的有效小数位数。
(三) 相关性分析
1. 软件操作
选择“统计”—“相关”—“相关系数” (图17),打开“相关”对话框。
在“相关”对话框,“变量Y”下选择“A”,“变量X”下选择“B”,点击“确定”。
2. 结果解读
图19是相关系数分析结果,可见相关系数r=0.8037,P=0.0001,提示两组数据之间存在相关性,表明A、B两种方法之间的差异具有较好的稳定性。
四、结论
本研究采用配对样本t检验判断A组和B组生化指标(X)含量是否存在差异。通过专业知识判断,数据不存在需要处理的异常值;通过绘制Q-Q图和Shapiro-Wilk检验,提示数据服从正态分布。
结果显示,A、B两组生化指标(X)平均值和标准差分别为0.341±0.035和0.305±0.023,A方法平均值比B方法高0.036 (95%CI为-0.047~-0.025),差异有统计学意义(t=-7.085,P=0.0001)。两组Pearson相关系数r = 0.804,P < 0.001;表明A、B两种方法之间的差异具有较好的稳定性。因此,本案例分析表明,使用A方法检测肌肉组织中生化指标(X)的含量通常会比B方法检测结果值要高。
五、知识小贴士
(一) 配对设计
临床研究过程中常见的两组配对设计包括:
- 同一组研究对象身体不同部位配对,如癌组织与癌旁组织某种基因的表达、左手和右手的血压比较。
- 条件配对,如在同一窝老鼠中选择性别和体重相同的2只作为一个对子,组成多个这样的对子;再将每个对子中的2只老鼠随机分配到2个处理组中去,然后比较两种处理方法的效果。
- 同一批标本不同检测方法配对,如同一批血液,被分成2份,分别用两种方法检测某种生化指标的含量(本案例属于该种类型)。
- 还有一类特殊的研究设计,同一组研究对象干预前后配对,如同一组病人使用降血糖药物前后空腹血糖值的比较。对于这类设计,尽管可使用配对样本t检验进行数据分析,但严格来说并不属于配对设计,而是属于干预前后的重复测量设计。
(二) 相关性分析
相关性的计算是为了验证配对数据的一致性,可以说明研究因素作用的稳定性或一致性,可能存在以下四种情况:
- 相关性检验与配对t检验的P值均<0.05,说明数据一致性较好,差异有统计学意义,而且差异的产生就是研究因素作用的结果。
- 相关性检验P>0.05,配对t检验的P<0.05,说明两组数据间存在差异,但对子间均数差异变化不一致,均数差异可能还受其他因素的影响。
- 相关性检验P<0.05,但配对t检验的P>0.05,说明数据变化有一致性,但均数差异不显著,即研究因素未发挥作用。
- 相关性检验与配对t检验的P值均>0.05,说明数据在两组间不具备一致性,且差异也无统计学意义。