配对样本t检验(Paired Samples t-test)——Stata软件实现

发布于 2022年1月2日 星期日 17:41:55 浏览:12484
原创不易,转载请注明来源,感谢!
附件下载:
配对样本t检验.zip 请勿重复点击,如无响应请耐心等待或稍后再试。

在前面文章中介绍了配对样本t检验(Paired Samples t-test)的假设检验理论 ,本篇文章将实例演示在Stata软件中实现配对样本t检验的操作步骤。

关键词:Stata; t检验; 配对样本t检验; 配对t检验; 成对t检验; 成组t检验; 关联样本t检验; 差值正态性

一、案例介绍

为检测肌肉组织中某生化指标(X)的含量,分别使用A、B两种方法检测17只小白鼠肌肉组织中该生化指标(X)的含量,试问两种方法检测的结果是否有差异?部分数据见图1。本文案例可从“附件下载”处下载。

图1

二、问题分析

本案例的分析目的是比较两个配对组别之间的均数是否存在差异,可以使用配对样本t检验。但需要满足五个条件:

条件1:观察变量为连续变量。本研究中的生化指标(X)含量为连续变量,该条件满足。

条件2:观察变量为配对设计。本研究中,两组数据均是对同一批研究对象测量所得,因此属于配对样本。该条件满足。

条件3:观察变量可分为2组,本研究中分为A方法和B方法两组,该条件满足。

条件4:观察变量不存在显著的异常值,该条件需要通过软件分析后判断。

条件5:两个配对组别间观察变量的差值服从正态(或近似正态)分布,该条件需要通过软件分析后判断。

三、软件操作及结果解读

(一) 适用条件判断

1. 条件4判断(异常值判断)

(1) 软件操作

①*描述性分析*

summarize A方法 B方法

图2

②*绘制箱式图*

graph box A方法 B方法

图3
(2) 结果解读

图2“summarize (描述性分析)”表格中,列出了A方法 、B方法两组观察变量的最小值和最大值,依据专业可判断人体生化指标(X)含量均可能存在0.275和0.399的情况;此外,图3中的箱线图也未提示任何异常值。综上,本案例未发现需要删除的异常值,满足条件4。

2. 条件5判断(正态性检验)

(1) 软件操作

①*使用Shapiro-Wilk检验考察两组差值的正态性*

gen d=B方法-A方法
swilk d
图4

②*绘制两组差值的的正态分位图*

qnorm d
图5
(2) 结果解读

图4显示A方法、 B方法两组观察变量差值的Shapiro-Wilk正态性检验结果P=0.257>0.1,提示两组数据差值服从正态分布。图5的正态分位图上两组差值的散点基本围绕对角线分布,也提示两组数据呈正态分布,综上,本案例满足条件5。关于正态性检验的注意事项详见推文(医学统计学核心概念及重要假设检验的软件实现(2/4)——正态性假设检验的SPSS实现)。

(二) 统计描述及推断

1. 软件操作

*配对样本t检验*

ttest A方法==B方法

图6

2. 结果解读

(1) 统计描述

图6“Paired Samples T-Test (配对样本t检验)”提供了研究案例的“obs (样本量)”、“Mean (均数)”、“Std. Dev (标准差)”和“Std .Err(标准误)”。可知,A方法组含量为0.341±0.035,B方法组含量为0.305±0.023。

(2) 统计推断

图6“Paired Samples T-Test (配对样本t检验)”提供了统计推断后的“t (t值)”、“degrees of freedom(自由度)”、P值、“diff (均数差)”及其“95% Confidence Interval (95%可信区间,95%CI)”。 可知药物注射后生化指标(X)含量降低0.036,95%CI为0.025~0.047;差异有统计学意义(t=7.085,P<0.001)。

(三)相关性分析

1. 软件操作

①*绘制散点图*

gr tw lfitci B方法 A方法|| sc B方法 A方法,ms(O)

图7

②*线性相关分析*

pwcorr A方法 B方法,sig star(.05) print(.05)

图8

2. 结果解读

图7的散点图提示,两组之间存在线性相关。图8相关分析结果可知,两组相关系数r = 0.804,P=0.0001,提示两组数据之间存在相关性。表明A、B两种方法之间的差异具有较好的稳定性。

相关性的计算是为了验证配对数据的一致性,可以说明研究因素作用的稳定性或一致性,可能存在四种情况。①相关性检验与配对t检验的P值均<0.05,说明数据一致性较好,差异有统计学意义,而且差异的产生就是研究因素作用的结果。②相关性检验P>0.05,配对t检验的P<0.05,说明两组数据间存在差异,但对子间均数差异变化不一致,均数差异可能还受其他因素的影响。③相关性检验P<0.05,但配对t检验的P>0.05,说明数据变化有一致性,但均数差异不显著,即研究因素未发挥作用。④相关性检验与配对t检验的P值均>0.05,说明数据在两组间不具备一致性,且差异也无统计学意义。本案例为第①种情况。

四、结论

本研究采用配对样本t检验判断A、B两种检测方法对肌肉组织中生化指标(X)的含量是否有影响。通过专业知识判断,数据不存在需要删除的异常值;通过绘制正态分位图和Shapiro-Wilk检验,提示两组数据差值服从正态分布。

结果显示,A、B方法检测肌肉组织中生化指标(X)的含量分别为0.341±0.035和0.305±0.023,A方法平均值比B方法高0.036 (95%CI:0.025~0.047),差异有统计学意义(t=7.085,P<0.001)。两组相关系数r = 0.804,P< 0.001;表明药物对生化指标(X)含量的影响作用稳定性较好。因此,本案例分析表明,使用A方法检测肌肉组织中生化指标(X)的含量通常会比B方法检测结果值要高。

End
文章目录 沉浸式阅读