配对样本平均值统计方法主要用于计量资料配对样本研究设计或配对样本差值比较,其样本量的计算方法根据已知参数和具体要求常可分为以下几种类型:
(1) 平均值法:已知两配对总体的平均值差、差值的标准差、检验水准、检验功效,求两个配对总体的均差与指定值相比得出统计学差异的最小样本量。
(2) 置信区间法:已知两配对总体的均差与其置信限的距离(容许误差)、指定配对差值的标准差、检验水准(置信度),求在此容许误差范围内估计配对总体均值所需的最小样本量。
(3) 等效性检验:已知治疗组(处理组)与对照组(非处理组)之间疗效指标的平均差、等效性界值的上下限、指定均差的标准差、检验水准、检验功效,求两组间总体均差位于等效性区间内所需的最小样本量。
本文主要介绍平均值法。
一、案例数据
为明确两种测量肺活量的仪器的检测效果,研究者欲征集一批志愿者,分别测量两种仪器对这批志愿者的最大呼气率,据早期研究,两配对样本差值的标准差为40.33L/min,若两种仪器所测的呼气率平均值差为17.17L/min,问至少需要招募多少名志愿者?
二、案例分析
呼气率数值为连续性资料,根据正态性检验,人体肺活量水平差值服从正态分布,且本案例中样本为随机样本,因此满足配对样本t检验的要求。
本研究中,计算配对样本平均值的差异性检验的样本量可采用平均值法,需要以下几个参数:
1. 两配对总体的平均值差D,本例中为17.17。
2. 两配对样本差值的标准差,本例中为40.33。
3. 检验水准α (通常取0.01至0.1,本例取0.05)。
4. 检验功效1-β (通常为0.8或更高,本例取0.9)。
5. 脱失率DR (通常不宜超过20%,本例取10%)。
在左侧界面中依次选择“Procedures (程序)”—“Means (均值)”—“Paired Means (配对样本均值)”—“Test (Inequality) (非均衡性检验)”—“Tests for Paired Means (配对样本均值检验)”,见图1。
三、软件操作
(一) 方法选择
(二) 参数设置
在“Design (设置)”模块中按以下参数设置相应选项(图2):
①Solve For: 选择“Sample Size”,表示本分析的目的是用于计算样本量。
②Alternative Hypothesis: 选择“Ha: Mean of Paired Diffs ≠0”,用于检验平均差是否为0,但预先不指定是>0还是<0。
③Nonparam.Adj.(Wilcoxon Test): 选择“Ignore”,表示不进行Wilcoxon校正,计算t检验结果。
④Population: 选择“Infinite”,表示假设样本是从极大(或无限)总体中抽样所得。
⑤Power and Alpha: Power为把握度,填写“0.90”;Alpha为检验水准,填写“0.05”。
⑥Effect Size: Means of Paired Differences(Alternative)表示指定的两组平均差D,本例填写“17.17”。
⑦Standard Deviation: S(Standard Deviation)表示差值的标准差,填“40.33”。
(三) 脱失率设置
在“Reports (结果报告)”模块中,勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”,在“Dropout Rate”中填写“10%”(图3),表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。
四、结果及解释
图4列出了该研究设计的相关参数和样本量计算结果,可知计算的样本例数(N)为60。
图5“References (参考文献)”列出了该计算过程中参考的相关文献;“Report Definitions (报告定义)”列出了各个参数的具体解释;“Summary Statements (报告概述)”为整个分析报告的摘要。
图6“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N'),也是研究实际开展过程中需要达到的最低样本量,本研究中为67。
图7为此次样本量估算整个过程的详细参数设置汇总。
五、结论
该案例为配对样本平均值的差异性检验样本量计算,用于检验两个配对总体的平均差是否大于、小于或者不等于指定值(通常为0)。已知两种仪器所测的呼气率平均值差为17.17L/min,差值的标准差为40.33L/min,若取检验水准0.05、检验功效0.90,要得到一组志愿者使用两种仪器所检测的呼气率平均水平不同的结论,至少需要60名志愿者。若考虑10%的脱失率,则至少需要67名志愿者。