关键词:t检验; 单样本t检验; 假设检验; 适用条件; 统计量
一、适用条件
单样本t检验,需要满足四个条件:
条件1:观察变量为连续变量。
条件2:观察变量相互独立。
条件3:观察变量不存在显著的异常值。
条件4:观察变量为(近似)正态分布。
二、统计量计算
单样本t检验(one sample/group t-test)即已知样本均数\( \overline{x} \) (代表未知总体均数μ)与已知总体均数μ0(一般为理论值、标准值或经过大量观察所得的稳定值等)的比较。其检验统计量为:
\(t=\frac{\overline{x}-\mu}{S_{\overline{x}}}=\frac{\overline{x}-\mu}{S/\sqrt{n}}=\frac{\overline{x}-\mu_0}{S/\sqrt{n}}\),\( v=n-1 \)
其中, \( v \) 为自由度(degree of freedom, df),指能够自由取值的变量个数。\({S_{\overline{x}}}\)为均数标准误的估计值,即样本均数的标准差,反映样本均数分布的离散程度,也反映样本均数与相应总体均数间的差异,说明了均数抽样误差的大小;与样本标准差的大小成正比,与样本含量n的平方根成反比。
三、案例数据
某医生测量了52名特殊作业成年男性工人的血红蛋白含量。假设已知正常成年男性血红蛋白含量均数为145g/L,试问特殊作业成年男性工人的血红蛋白含量是否与正常成年男性有差异?数据见图1。
四、假设检验
(一) 建立检验假设,确定检验水准
H0:μ = μ0 = 145g/L,即从事特殊作业的男性工人与正常成年男性的血红蛋白含量均数相等
H1:μ ≠ μ0 = 145g/L,即从事特殊作业的男性工人与正常成年男性的血红蛋白含量均数不等
α = 0.05
(二) 计算检验统计量
本例n = 52, \( \overline{x} \)= 128.308 g/L,S = 17.597 g/L,μ0 =145 g/L。按上述样本量公式计算得:
\(t=\frac{128.308-145}{17.597/\sqrt{52}}=-6.840\),\(v=52-1=51\)
(三) 确定P值,作出推断结论
以V= 51,|t|=|-6.840|=6.840查(t界值表),因6.840>t0.001/2,50=3.496,故P<0.001。按α = 0.05水准,拒绝H0,接受H1,差异有统计学意义。结合本题可认为从事特殊作业男性工人的平均血红蛋白含量低于正常成年男性的平均血红蛋白含量。