关键词:Stata; t检验; 独立样本t检验; 成组t检验; 两样本均数比较; 近似t检验; 韦尔奇t检验; Welch近似t检验
一、案例介绍
某医生研究某生化指标(X)对病毒性肝炎诊断的临床意义,测得20名正常人和19名病毒性肝炎患者生化指标(X)含量(μg/dl),问病毒性肝炎患者和正常人生化指标(X)含量是否存在差异?部分数据见图1。本文案例可从“附件下载”处下载。
二、问题分析
本案例的分析目的是比较两组数据均值是否有差异,即判断病毒性肝炎患者和正常人生化指标(X)含量是否存在差异。针对这种情况可以使用独立样本t检验。但需要满足6个条件:
条件1:观察变量为连续变量。本研究中的生化指标含量为连续变量,该条件满足。
条件2:观察变量相互独立。本研究中各研究对象的观察变量都是独立的,不存在互相干扰的情况,该条件满足。
条件3:观察变量可分为2组。本研究中分为病毒性肝炎患者和正常人,该条件满足。
条件4:观察变量不存在显著的异常值,该条件需要通过软件分析后判断。
条件5:各组观察变量为正态(或近似正态)分布,该条件需要通过软件分析后判断。
条件6:两组观察变量的方差相等,该条件需要通过软件分析后判断。
三、软件操作及结果解读
(一) 适用条件判断
1. 条件4判断(异常值判断)
(1) 软件操作
①*描述性分析*
summarize X if group==1
summarize X if group==2
②*绘制箱式图*
graph box X,over(group)
(2) 结果解读
图2和图3“Descriptives (描述性分析)”表格中,列出了各组观察变量的“Min(最小值)”和“Max(最大值)”,依据专业可判断人体生化指标含量均可能存在215.4μg/dl和292.7μg/dl的情况;此外,图4中的箱线图也未提示任何异常值。综上,本案例未发现需要删除的异常值,满足条件4。
2. 条件5判断(正态性检验)
(1) 软件操作
①*使用Shapiro-Wilk检验分别考察每组的正态性*
swilk X if group==1
swilk X if group==2
②*分别绘制每组的正态分位图*
qnorm X if group==1
qnorm X if group==2
(2) 结果解读
图5、图6的Shapiro-Wilk正态性检验结果分别显示两组的P=0.886和0.200,均>0.1,提示两组数据服从正态分布。图7、图8的正态分位图上两组散点基本围绕对角线分布,也提示两组数据呈正态性分布;综上,本案例满足条件5。
3. 条件6判断(方差齐性检验)
(1) 软件操作
*方差齐性检验*
robvar X, by(group)
(2) 结果解读
图9显示,正常人组和肝炎患者组的标准差(Std. Dev)分别为9.168和13.695,W0是levene方差齐性检验,可见F=3.883,P=0.056<0.1,提示两组数据方差不齐,不满足条件6。
(二) 统计描述及推断
由于本案例满足正态性要求,但不满足方差齐性要求,所以采用方差不齐情况下的分析结果。
1. 软件操作
ttest X, by(group) unequal
2. 结果解读
(1) 统计描述
图10结果提供了研究案例的“Group (组别)”、“Obs (样本量)”、“Mean (均数)”、“SD (标准差)”和“SE (标准误)”“95%CI(95%的置信区间)”。可知,正常人群的生化指标含量为271.300±9.168 μg/dl,肝炎患者的生化指标含量为236.216±13.695 μg/dl。
(2) 统计学推断
图10 “Two Sample T-Test with unequal variances(方差不齐的两独立样本t检验)”表格中提供了不满足方差齐性情况下,独立样本t检验(Independent Samples T-Test)分析的“Statistic (统计量)”、“df (自由度)”、P值、“Mean (均数)”及其“95% Confidence Interval (95%可信区间,95%CI)”。由于本案例满足正态性要求,但不满足方差齐性要求,所以采用方差不齐情况下分析结果。可知肝炎患者的生化指标含量平均值比正常人群低35.084μg/dl,95%CI为27.435~42.733;差异有统计学意义(t′=9.352,P<0.001)。
四、结论
本研究采用独立样本t检验判断病毒性肝炎患者和正常人生化指标含量是否存在差异。通过专业知识判断,两组数据不存在需要删除的异常值;通过绘制正态分位图和Shapiro-Wilk检验,提示两组数据服从正态分布;通过方差齐性检验,提示两组数据间方差不齐,采用方差不齐情况下分析结果。 结果显示,正常人群和肝炎患者的生化指标含量分别为271.300±9.168μg/dl和236.216±13.695μg/dl;肝炎患者的生化指标含量平均值比正常人群低35.084μg/dl (95%CI:27.435~42.733),差异有统计学意义(t′=9.352,P<0.001)。因此,可以认为该生化指标含量对病毒性肝炎的临床诊断具有价值。