原始资料的独立样本t检验(Independent Samples t-test)——MedCalc软件实现

发布于 2022年7月4日 星期一 21:56:11 浏览:2109
原创不易,转载请注明来源,感谢!
附件下载:
原始资料的独立样本t检验.zip 请勿重复点击,如无响应请耐心等待或稍后再试。

独立样本t检验又称成组t检验(two-sample/group t-test)或两独立样本t检验(two independent-sample t-test),医学研究中常用于完全随机设计两样本均数的比较,即将受试对象完全随机分配到两个不同处理组,研究者关心的是两样本均数所代表的两总体均数是否不等。前面介绍了独立样本t检验的相关理论(独立样本t检验(Independent Samples t-test)——理论介绍),本文介绍原始资料的独立样本t检验在MedCalc软件中的操作过程。

关键词:MedCalc; t检验; 独立样本t检验; 成组t检验; 两样本均数比较

一、案例介绍

某医生研究某生化指标(X)对病毒性肝炎诊断的临床意义,测得20例正常人(group=1)和19例病毒性肝炎(group=2)患者生化指标(X)含量(μg/dl),问病毒性肝炎患者和正常人生化指标(X)含量是否存在差异?部分数据见图1。案例可从“附件下载”处下载。

图 1

二、问题分析

本案例的分析目的是比较病毒性肝炎患者和正常人生化指标(X)含量是否存在差异。针对这种情况可以使用独立样本t检验,需要满足6个条件:

条件1:观察变量为连续变量。

条件2:观察变量相互独立。

条件3:观察变量分为2组。

条件4:观察变量不存在显著的异常值。

条件5:各组观察变量为正态(或近似正态)分布。

条件6:两组观察变量的方差相等。

三、软件操作及结果解读

(一) 适用条件判断

对于本案例数据,条件1、2、3均满足。下面判断条件4、5、6。

1. 条件4判断(异常值判断)

(1) 软件操作

选择“统计”—“异常值检测”(图2),打开“异常值检测”对话框

图 2

在“异常值检测”对话框(图3),“变量”下选择变量“X”,“筛选条件”下选择“group=1”;“异常值检测方法”下勾选“Grubbs-两侧”、“生成的ESD检验”(“检验最大量的异常值”中输入10)、“Tukey”

图 3
(2) 结果解读

图4为正常人组(group=1)异常值检测结果,提示无异常值。

图 4

点击图4右下角的“盒形图”,出现“盒形图”对话框(图5),“变量”下选择“X”,“筛选条件”下选择“group=1”,“选项”中勾选“标绘所有数据”,图表方向选择“垂直”。可得到正常人组的盒形图(图6),提示无异常值。

图 5
图 6

参照上述操作可得到肝炎患者组的异常值检测结果(图7、图8),结果也提示无异常值。

图 7
图 8

2. 条件5判断(正态性检验)

独立样本t检验需要分别检验每组原始数据的正态性情况,或者检测整体残差的正态分布情况,此处先介绍分组检测每组原始数据的正态分布情况,整体残差的正态分布情况见独立样本t检验分析过程。

(1) 软件操作

选择“统计”—“分布图”—“正态图”(图9)。

图 9

在“正态图”对话框(图10),“变量”下选择变量“X”,“筛选条件”下选择“group=1”,“选项”中勾选“Q-Q图”,“检验正态分布”下选择“Shapiro-Wilk检验 (夏皮罗-威尔克正态性检验,S-W检验)”。

图 10
(2) 结果解读

图11为正常人组(group=1)的Q-Q图,散点基本围绕对角线分布,提示数据呈正态分布。在该组异常值检测结果中(图4), Shapiro-Wilk检验 (夏皮罗-威尔克正态性,S-W检验)显示,P=0.8129>0.1,也提示数据服从正态分布。同样参照图10绘制Q-Q图的步骤可得到肝炎患者组的Q-Q图如图12所示,该组异常值检测结果中(图7)给出了S-W检验结果,两者都提示数据服从正态分布。综上,本案例满足条件4。关于正态性检验的更多内容请阅读(医学统计学核心概念及重要假设检验的软件实现(2/4) ——正态性假设检验的SPSS实现)。

图 11
图 12

3. 条件6判断(方差齐性检验)

详见下文。

(二) 统计描述及推断

1. 软件操作

选择“统计”—“T检验”—“独立样本t检验” (图13),打开“独立样本t检验”对话框

图 13

在“独立样本t检验”对话框,”采样1”的“变量”下选择“X”,筛选条件中输入“group=1”,”采样2”的“变量”下选择“X”,筛选条件中输入“group=2”,“置信区间%”下选“95”,“修正不等方差”下选择“两者兼具”,“检验正态分布”下选择“Shapiro-Wilk检验 (夏皮罗-威尔克正态性检验,S-W检验)。”见图14。

图 14

2. 结果解读

(1) 条件5补充判断(正态性检验)

图15为整体残差的Shapiro-Wilk检验 (夏皮罗-威尔克正态性,S-W检验)结果,可知W=0.9615,P=0.2001,提示整体残差满足正态性。和分组检测各组原始数据的正态性结果一致。

图 15
(2)条件6判断(方差齐性检验)

由图16 的“等方差的F检验”结果可知,P=0.091<0.1,提示方差不齐,因此建议选择校正t检验 (Welch检验) 的分析结果。

图 16
(3) 统计描述

图16为统计学描述结果,可知正常人生化指标(X)平均值和标准差为(271.30±2.05)μg/dl,病毒性肝炎患者生化指标(X)平均值和标准差为(236.22±3.14)μg/dl。点击图15右下角的“数据对比图表”可以进入“数据对比图表”对话框(图17),点击确定可得到两组数据的小提琴图(图18)。从均值看两组的生化指标含量可能存在差异,但还需要依据统计学检验的结果进行判断。

图 17
图 18
(4) 统计推断

图19为校正t检验 (Welch检验) 的分析结果。可知,病毒性肝炎患者生化指标的平均值比正常人生化指标的平均值低35.0842μg/dl,95%CI为-42.7356~-27.4328,差异有统计学意义(t′=-9.352,P<0.0001),可根据需要保留相应的有效位数。

图 19

四、结论

本研究采用独立样本t检验判断病毒性肝炎患者和正常人生化指标(X)含量是否存在差异。通过专业知识判断,数据不存在需要处理的异常值;通过绘制Q-Q图和Shapiro-Wilk检验,提示数据服从正态分布。通过方差齐性检验,提示两组数据间方差不齐,采用校正t检验对数据进行分析。

结果显示,病毒性肝炎患者生化指标平均值为(236.22±3.14)μg/dl,与正常人生化指标平均值(271.30±2.05)μg/dl的差值为35.08 μg/dl(95%CI为-42.74~-27.43),差异有统计学意义(t′=-9.352,P<0.0001)。因此,可以认为该生化指标含量在病毒性肝炎患者和正常人群之间存在统计学差异,病毒性肝炎患者的该生化指标值低于正常人群。

五、分析小技巧

  • 在进行独立样本t检验时,可分别检验每组原始数据的正态性情况,或者检测整体残差的正态分布情况。若是分组检测原始数据的正态性,需要按组别分别进行,而不是对全部数据进行一次正态性检验。
  • t检验对数据的非正态性有一定的耐受能力,如果资料只是稍微偏态,结果仍然稳健。
  • 独立样本t检验时对两组数据之间的方差齐性要求较为严格,与数据违反正态性相比,方差不齐对结论的影响较大。
  • 如果数据对条件1至条件5都满足,仅不满足方差齐,此时可使用校正t检验(Welch’s t检验)。但如果数据的方差相差太大,最好使用非参数检验(Mann-Whitney U检验)。如果数据正态性和方差齐性都不满足,最好使用非参数检验(Mann-Whitney U检验)。
  • 如果两组数据之间方差的差异无统计学意义,此时student’s t检验比Welch’s t检验具有更高的统计学检验效能(发生第II类错误的概率更低),如果两组数据方差差异较大,此时Welch’s t检验发生第II类错误的概率更低,结果更为可信。
  • 与数据违反正态性相比,方差不齐对结论的影响较大,所以主要依靠假设检验进行考察。然而“方差齐性检验(Levene’s)”的结果易受到样本量的影响,并不是很稳定。当样本量较大时,倾向于得出P值低于检验水准的结论,尽管可能组别之间的方差差异并不大;反之,当样本量较小时,尽管组别之间的方差差异可能较大,但倾向于得出P值高于检验水准的结论。因此,以统计描述的形式报告各组数据的具体标准差和方差,并将其纳入综合考量是必要的。
End
文章目录 沉浸式阅读