单样本平均值统计方法主要用于定量资料单样本研究设计,已知预试验(预调查)的均值和标准差、总体的均值、检验水准、检验功效,求研究群体与总体均值相比得出统计学差异的最小样本量。
一、案例数据
欲研究从事铅作业男性工人的血红蛋白含量与正常成年男性的血红蛋白水平有无差异,选择36名从事铅作业男性工人进行预调查,测得这些铅作业工作者的血红蛋白含量为130.83 g/L,标准差为25.74 g/L,已知正常成年男性的血红蛋白平均水平为 140 g/L。问至少需要多少从事铅作业工人参与调查才能得出两类人群血红蛋白水平不同的结论?
二、案例分析
血红蛋白数值为连续性资料,根据以往经验,人体血红蛋白水平服从正态分布,且本案例中样本为随机样本,因此满足单样本t检验的要求。
本研究中,计算单样本平均值的差异性检验的样本量可采用平均值法,需要以下几个参数:
- 预试验(预调查)的均值Mean1和标准差S,本例中分别为130.83和25.74。
- 指定的比较均值Mean0,本例中为140。
- 检验水准α (通常取0.01至0.1,本研究取0.05)。
- 检验功效1-β (通常为0.8或更高,本研究取0.9)。
- 脱失率DR (通常不宜超过20%,本研究取10%)。
三、软件操作
(一) 方法选择
在左侧界面中依次选择“Procedures (程序)”—“Means (均值)”—“One Mean (单样本均值)”—“Test (Inequality) (非均衡性检验)”—“Test for One Means (单样本均值检验)”,见图1。
(二) 参数设置
在“Design (设置)”模块中按以下参数设置相应选项(图2):
① Solve For: 选择“Sample Size”,表示本分析的目的是用于计算样本量。
② Alternative Hypothesis: 选“Mean0≠Mean1”,用于检验平均值是否不同,但预先不指定哪个平均值更大。
③ Nonparam.Adj.(Wilcoxon Test): 选择“Ignore”,表示不进行Wilcoxon校正,计算t检验结果。
④ Population Size: 选择“Infinite”,表示假设样本是从极大(或无限)总体中抽样所得。
⑤ Power and Alpha: Power为把握度,填写“0.90”;Alpha为检验水准,填写“0.05”。
⑥ Effect Size: Mean0 (Null or Baseline)表示指定的比较均值,填“140”;Mean0 (Alternative)表示预试验(预调查)的均值,填“130.83”。
⑦ Standard Deviation: S(Standard Deviation)表示预试验(预调查)的标准差,填“25.74”。
(三) 脱失率设置
在“Reports (结果报告)”模块中,勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”,在“Dropout Rate”中填写“10%”(图3),表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。
四、结果及解释
图4列出了该研究设计的相关参数和样本量计算结果,可知计算的样本例数(N)为85。
图5“References (参考文献)”列出了该计算过程中参考的相关文献;“Report Definitions (报告定义)”列出了各个参数的具体解释;“Summary Statements (报告概述)”为整个分析报告的摘要。
图6“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N'),也是研究实际开展过程中需要达到的最低样本量,本研究中为95。
图7为此次样本量估算整个过程的详细参数设置汇总。
五、结论
该案例为单样本平均值的差异性检验样本量计算,由预调查可知铅作业男性工人的血红蛋白含量为130.83±25.74 g/L,正常成年男性的血红蛋白平均水平为140 g/L。若取检验水准0.05、检验功效0.90,要得到铅作业工人与正常人群血红蛋白平均水平不同的结论,至少需要85例研究对象。若考虑10%的脱失率,则至少需要95例研究对象。