独立样本t检验(Independent Samples t-test)—Stata软件实现

发布于 2022年1月2日 星期日 17:05:11 浏览:11686
原创不易,转载请注明来源,感谢!
附件下载:
独立样本t检验.zip 请勿重复点击,如无响应请耐心等待或稍后再试。

在前面文章中介绍了独立样本t检验(Independent Samples t-test)的假设检验理论 ,本篇文章将实例演示在Stata软件中实现独立样本t检验的操作步骤。

关键词:Stata; t检验; 独立样本t检验; 成组t检验; 两样本均数比较; 近似t检验; 韦尔奇t检验; Welch近似t检验

一、案例介绍

某医生研究某生化指标(X)对病毒性肝炎诊断的临床意义,测得20名正常人和19名病毒性肝炎患者生化指标(X)含量(μg/dl),问病毒性肝炎患者和正常人生化指标(X)含量是否存在差异?部分数据见图1。本文案例可从“附件下载”处下载。

图1

二、问题分析

本案例的分析目的是比较两组数据均值是否有差异,即判断病毒性肝炎患者和正常人生化指标(X)含量是否存在差异。针对这种情况可以使用独立样本t检验。但需要满足6个条件:
条件1:观察变量为连续变量。本研究中的生化指标含量为连续变量,该条件满足。
条件2:观察变量相互独立。本研究中各研究对象的观察变量都是独立的,不存在互相干扰的情况,该条件满足。
条件3:观察变量可分为2组。本研究中分为病毒性肝炎患者和正常人,该条件满足。
条件4:观察变量不存在显著的异常值,该条件需要通过软件分析后判断。
条件5:各组观察变量为正态(或近似正态)分布,该条件需要通过软件分析后判断。
条件6:两组观察变量的方差相等,该条件需要通过软件分析后判断。

三、软件操作及结果解读

(一) 适用条件判断

1. 条件4判断(异常值判断)

(1) 软件操作

①*描述性分析*

summarize X if group==1

图2

summarize X if group==2

图3

②*绘制箱式图*

graph box X,over(group)

图4
(2) 结果解读

图2和图3“Descriptives (描述性分析)”表格中,列出了各组观察变量的“Min(最小值)”和“Max(最大值)”,依据专业可判断人体生化指标含量均可能存在215.4μg/dl和292.7μg/dl的情况;此外,图4中的箱线图也未提示任何异常值。综上,本案例未发现需要删除的异常值,满足条件4。

2. 条件5判断(正态性检验)

(1) 软件操作

①*使用Shapiro-Wilk检验分别考察每组的正态性*

swilk X if group==1

图5

swilk X if group==2

图6

②*分别绘制每组的正态分位图*

qnorm X if group==1

图7

qnorm X if group==2

图8
(2) 结果解读

图5、图6的Shapiro-Wilk正态性检验结果分别显示两组的P=0.886和0.200,均>0.1,提示两组数据服从正态分布。图7、图8的正态分位图上两组散点基本围绕对角线分布,也提示两组数据呈正态性分布;综上,本案例满足条件5。

3. 条件6判断(方差齐性检验)

(1) 软件操作

*方差齐性检验*

robvar X, by(group)

图9
(2) 结果解读

图9显示,正常人组和肝炎患者组的标准差(Std. Dev)分别为9.168和13.695,W0是levene方差齐性检验,可见F=3.883,P=0.056<0.1,提示两组数据方差不齐,不满足条件6。

(二) 统计描述及推断

由于本案例满足正态性要求,但不满足方差齐性要求,所以采用方差不齐情况下的分析结果。

1. 软件操作

ttest X, by(group) unequal

图10

2. 结果解读

(1) 统计描述

图10结果提供了研究案例的“Group (组别)”、“Obs (样本量)”、“Mean (均数)”、“SD (标准差)”和“SE (标准误)”“95%CI(95%的置信区间)”。可知,正常人群的生化指标含量为271.300±9.168 μg/dl,肝炎患者的生化指标含量为236.216±13.695 μg/dl。

(2) 统计学推断

图10 “Two Sample T-Test with unequal variances(方差不齐的两独立样本t检验)”表格中提供了不满足方差齐性情况下,独立样本t检验(Independent Samples T-Test)分析的“Statistic (统计量)”、“df (自由度)”、P值、“Mean (均数)”及其“95% Confidence Interval (95%可信区间,95%CI)”。由于本案例满足正态性要求,但不满足方差齐性要求,所以采用方差不齐情况下分析结果。可知肝炎患者的生化指标含量平均值比正常人群低35.084μg/dl,95%CI为27.435~42.733;差异有统计学意义(t′=9.352,P<0.001)。

四、结论

本研究采用独立样本t检验判断病毒性肝炎患者和正常人生化指标含量是否存在差异。通过专业知识判断,两组数据不存在需要删除的异常值;通过绘制正态分位图和Shapiro-Wilk检验,提示两组数据服从正态分布;通过方差齐性检验,提示两组数据间方差不齐,采用方差不齐情况下分析结果。 结果显示,正常人群和肝炎患者的生化指标含量分别为271.300±9.168μg/dl和236.216±13.695μg/dl;肝炎患者的生化指标含量平均值比正常人群低35.084μg/dl (95%CI:27.435~42.733),差异有统计学意义(t=9.352,P<0.001)。因此,可以认为该生化指标含量对病毒性肝炎的临床诊断具有价值。

End
文章目录 沉浸式阅读