关键词:jamovi; t检验; 单样本t检验
一、案例介绍
某医生测量了52名特殊作业成年男性工人的血红蛋白含量。假设已知正常成年男性血红蛋白含量均数为145g/L,试问特殊作业成年男性工人的血红蛋白含量是否与正常成年男性有差异?部分数据见图1。本文案例可从“附件下载”处下载。
二、问题分析
本案例的分析目的是比较研究样本与已知均数是否相同。针对这种情况可以使用单样本t检验。但需要满足4个条件:
条件1:观察变量为连续变量。本研究中的血红蛋白为连续变量,该条件满足。
条件2:观察变量相互独立。本研究中各研究对象的观测值都是独立的,不存在互相干扰的情况,该条件满足。
条件3:观察变量不存在显著的异常值,该条件需要通过软件分析后判断。
条件4:观察变量为正态或近似正态分布,该条件需要通过软件分析后判断。
三、软件操作及结果解读
(一) 适用条件判断
1. 条件3判断(异常值判断)
(1) 软件操作
① 选择“分析”—“探索”—“描述”,将观察变量“Hb”选入右侧“变量”框(图2)。
② 在“统计分析”下的“样本量”中勾选“个案数”、“缺失”,在“集中趋势”中勾选“均值”、“中位数”,在“离散”中勾选“标准差”、“最小值”和“最大值”(图3),结果如图4所示。
③ 在“绘图”下的“箱线图”中勾选“箱线图”和“Lable outliers (异常值标签)”,“数据”下拉菜单中选择“散点”(图5),结果如图6所示。
(2) 结果解读
图4“描述”表格中,列出了观察变量的最小值和最大值,依据专业可判断人体血红蛋白含量均可能存在89g/L和165g/L的情况;此外,图6中的箱线图尽管提供了部分异常值的标签,但依据专业意义尚不认为需要进行特殊处理。综上,本案例未发现需要处理的异常值,满足条件3。
2. 条件4判断(正态性检验)
(1) 软件操作
① 选择“分析”—“ T检验”—“单样本T检验”,将“Hb”选入右侧“因变量”框(图7)。
② 在“适用条件判断”中勾选“正态性检验”、“Q-Q图”(图8),结果如图9和图10所示。
(2) 结果解读
由图9的“ 正态性检验(Shapiro-Wilk)”表格结果显示P=0.179>0.1,提示数据服从正态分布;此外图10 Q-Q图上散点基本围绕对角线分布,也提示数据呈正态分布。综上,本案例满足条件4。
(二) 统计描述及推断
1. 软件操作
选择“分析”—“ T检验”—“单样本T检验” (图7),在“假设检验”下的“比较值”中输入145,其他选项见图11,结果见图12和图13。
2. 结果解读
(1) 统计描述
图12“描述”表格中提供了研究案例的“个案数”、“均数”、“中位数”、“标准差”和“标准误”。可知样本人群的血红蛋白含量为128.308±17.597g/L。
(2) 统计学推断
图13的“单样本T检验”表格中提供了推计学推断的“统计量”、“自由度”、P值、“均值差”及其“95%置信区间”、“效应量”。
可知样本人群的血红蛋白含量平均值比正常人群低16.692g/L,95%置信区间为-21.591~-11.793;差异有统计学意义(t=-6.84,P<0.001)。Cohen's d为-0.949,95%置信区间为-1.273~-0.617,为高效应。
四、结论
本研究采用单样本t检验判断某特殊作业成年男性工人的血红蛋白含量是否与正常成年男性有差异。通过专业知识判断,数据不存在需要处理的异常值;通过绘制Q-Q图和Shapiro-Wilk检验,提示数据服从正态分布。
结果显示,某特殊作业成年男性人群的血红蛋白含量为128.308±17.597g/L,与正常成年男性人群血红蛋白均值145g/L的差值为16.692 (95%CI:-21.591~-11.793)。单样本t检验提示,样本人群的血红蛋白含量低于正常成年男性(t=-6.840,P<0.001),Cohen's d效应量为-0.949 (95%CI:-1.273~-0.617),差异较大。本研究结果提示某特殊作业成年男性工人的血红蛋白含量低于正常成年男性。
五、分析小技巧
(一) 异常值检测及处理
1. 异常值的检测
异常值的检测有多种方法,包括:
- 专业判断。基于专业角度判断数值是否为异常值往往是最基础且可靠的方法,很多通过统计学方法检测提示的异常值,最终也需要从专业角度衡量是否为真正的异常值;但在实际研究过程中,一些变量指标难以从专业角度进行衡量是否异常。
- 图形法,包括直方图法、箱式图法等。在直方图上,位于图形两端,并远离均数的数值,一般提示可能存在异常;在箱式图上位于上下四分位数±1.5倍四分位间距的数值,一般提示可能存在异常。
- 统计描述法。一般位于均数±3倍标准差之外的数据,提示可能存在异常。
- 马氏距离法,常用于多变量异常值的检测。
2. 异常值的处理
对于异常值的处理需要注意:
- 异常值产生的原因不明之前,不应简单决定其取舍,通过图形法和统计描述法检测出的异常值,最好再从专业角度进行判断是否为真正的异常值。
- 尽可能核对原始记录,如果确认数据有逻辑错误,又无法纠正,可直接删除。
- 如果数据无明显逻辑错误,可将数据删除前后各做一次分析,若结果不矛盾,则不予删除;若结果矛盾且需要删除数据时,必须给予充分合理的解释。
- 如果采用其他数值替换异常值,最好对替换前后的数据各做一次分析,并对结果进行比较。
(二) 效应量
- Cohen's d (科恩d值)效应量是用以衡量自变量和因变量之间关联强度的指标,主要用于t检验,表明两个均数之间的标准差异,该指标不受样本量的影响,表示不同处理下的总体均值之间差异的大小,可以在不同研究之间进行比较。判断标准为绝对值<0.2为极小效应,0.2~0.5为中等效应,0.5~0.8为较高效应,≥0.8为高效应。当样本量较大时,很容易出现P<0.05的情况,此时效应量非常有用。如本案例Cohen's d=-0.949表示,样本人群的均数(128)比正常人群的均数(145)低0.949个标准差(17.6)。