关键词:Stata; t检验; 配对样本t检验; 配对t检验; 成对t检验; 成组t检验; 关联样本t检验; 差值正态性
一、案例介绍
为检测肌肉组织中某生化指标(X)的含量,分别使用A、B两种方法检测17只小白鼠肌肉组织中该生化指标(X)的含量,试问两种方法检测的结果是否有差异?部分数据见图1。本文案例可从“附件下载”处下载。
二、问题分析
本案例的分析目的是比较两个配对组别之间的均数是否存在差异,可以使用配对样本t检验。但需要满足五个条件:
条件1:观察变量为连续变量。本研究中的生化指标(X)含量为连续变量,该条件满足。
条件2:观察变量为配对设计。本研究中,两组数据均是对同一批研究对象测量所得,因此属于配对样本。该条件满足。
条件3:观察变量可分为2组,本研究中分为A方法和B方法两组,该条件满足。
条件4:观察变量不存在显著的异常值,该条件需要通过软件分析后判断。
条件5:两个配对组别间观察变量的差值服从正态(或近似正态)分布,该条件需要通过软件分析后判断。
三、软件操作及结果解读
(一) 适用条件判断
1. 条件4判断(异常值判断)
(1) 软件操作
①*描述性分析*
summarize A方法 B方法
②*绘制箱式图*
graph box A方法 B方法
(2) 结果解读
图2“summarize (描述性分析)”表格中,列出了A方法 、B方法两组观察变量的最小值和最大值,依据专业可判断人体生化指标(X)含量均可能存在0.275和0.399的情况;此外,图3中的箱线图也未提示任何异常值。综上,本案例未发现需要删除的异常值,满足条件4。
2. 条件5判断(正态性检验)
(1) 软件操作
①*使用Shapiro-Wilk检验考察两组差值的正态性*
gen d=B方法-A方法 swilk d
②*绘制两组差值的的正态分位图*
qnorm d
(2) 结果解读
图4显示A方法、 B方法两组观察变量差值的Shapiro-Wilk正态性检验结果P=0.257>0.1,提示两组数据差值服从正态分布。图5的正态分位图上两组差值的散点基本围绕对角线分布,也提示两组数据呈正态分布,综上,本案例满足条件5。关于正态性检验的注意事项详见推文(医学统计学核心概念及重要假设检验的软件实现(2/4)——正态性假设检验的SPSS实现)。
(二) 统计描述及推断
1. 软件操作
*配对样本t检验*
ttest A方法==B方法
2. 结果解读
(1) 统计描述
图6“Paired Samples T-Test (配对样本t检验)”提供了研究案例的“obs (样本量)”、“Mean (均数)”、“Std. Dev (标准差)”和“Std .Err(标准误)”。可知,A方法组含量为0.341±0.035,B方法组含量为0.305±0.023。
(2) 统计推断
图6“Paired Samples T-Test (配对样本t检验)”提供了统计推断后的“t (t值)”、“degrees of freedom(自由度)”、P值、“diff (均数差)”及其“95% Confidence Interval (95%可信区间,95%CI)”。 可知药物注射后生化指标(X)含量降低0.036,95%CI为0.025~0.047;差异有统计学意义(t=7.085,P<0.001)。
(三)相关性分析
1. 软件操作
①*绘制散点图*
gr tw lfitci B方法 A方法|| sc B方法 A方法,ms(O)
②*线性相关分析*
pwcorr A方法 B方法,sig star(.05) print(.05)
2. 结果解读
图7的散点图提示,两组之间存在线性相关。图8相关分析结果可知,两组相关系数r = 0.804,P=0.0001,提示两组数据之间存在相关性。表明A、B两种方法之间的差异具有较好的稳定性。
相关性的计算是为了验证配对数据的一致性,可以说明研究因素作用的稳定性或一致性,可能存在四种情况。①相关性检验与配对t检验的P值均<0.05,说明数据一致性较好,差异有统计学意义,而且差异的产生就是研究因素作用的结果。②相关性检验P>0.05,配对t检验的P<0.05,说明两组数据间存在差异,但对子间均数差异变化不一致,均数差异可能还受其他因素的影响。③相关性检验P<0.05,但配对t检验的P>0.05,说明数据变化有一致性,但均数差异不显著,即研究因素未发挥作用。④相关性检验与配对t检验的P值均>0.05,说明数据在两组间不具备一致性,且差异也无统计学意义。本案例为第①种情况。
四、结论
本研究采用配对样本t检验判断A、B两种检测方法对肌肉组织中生化指标(X)的含量是否有影响。通过专业知识判断,数据不存在需要删除的异常值;通过绘制正态分位图和Shapiro-Wilk检验,提示两组数据差值服从正态分布。
结果显示,A、B方法检测肌肉组织中生化指标(X)的含量分别为0.341±0.035和0.305±0.023,A方法平均值比B方法高0.036 (95%CI:0.025~0.047),差异有统计学意义(t=7.085,P<0.001)。两组相关系数r = 0.804,P< 0.001;表明药物对生化指标(X)含量的影响作用稳定性较好。因此,本案例分析表明,使用A方法检测肌肉组织中生化指标(X)的含量通常会比B方法检测结果值要高。