一、案例数据
某高校欲随机抽查部分男生的身高以评估其青春期的生长发育情况,假设该高校男生身高的标准差为5.0cm,若规定容许误差不超过0.6cm,容许概率为90%,试估计所需的样本含量。
二、案例分析
身高数值为连续性资料,根据既往科学研究,人体身高水平服从正态分布,且本案例中样本为随机样本,因此满足单样本t检验的要求。
本研究中,计算单样本平均值的样本量可采用容许概率法,需要以下几个参数:
- 指定的容许误差δ,本例中为0.6。
- 指定的容许概率,本例为0.9。
- 检验水准α (通常取0.01至0.1,本研究取0.05)。
- 置信度/可信度CL(即1-α,常用0.95或0.99,本研究取0.95)。
- 总体标准差σ,本例中为5.0。
- 脱失率DR (通常不宜超过20%,本研究取10%)。
三、软件操作
(一) 方法选择
在左侧界面中依次选择“Procedures (程序)”—“Means (均值)”—“One Mean (单样本均值)”—“ Confidence Interval (置信区间法)”—“Confidence Intervals for One Mean with Tolerance Probability(指定容许概率的单样本平均值的置信区间)”,见图1。
(二) 参数设置
在“Design (设置)”模块中按以下参数设置相应选项(图2):
- Solve For: 选择“Sample Size”,表示本分析的目的是用于计算样本量。
- Interval Type: 选择“Two-Sided”,表示使用双侧置信区间。
- Population: 选择“Infinite”,表示假设样本是从极大(或无限)总体中抽样所得。
- Confidence Level(1-Alpha):表示置信度CL,即为1-α,填写“0.95”。
- Tolerance Probability:表示容许概率,本例填“0.90”。
- Distance from Mean to Limit(s):即置信限到平均值的距离D,又称容许误差δ,本例填“0.6”。
- Standard Deviation: S(Standard Deviation)表示总体标准差,填“5.0”。
(三) 脱失率设置
在“Reports (结果报告)”模块中,勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”,在“Dropout Rate”中填写“10%”(图3),表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。
四、结果及解释
图4列出了该研究设计的相关参数和样本量计算结果,可知计算的样本例数(N)为298。
图5“References (参考文献)”列出了该计算过程中参考的相关文献;“Report Definitions (报告定义)”列出了各个参数的具体解释;“Summary Statements (报告概述)”为整个分析报告的摘要。
图6“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N'),也是研究实际开展过程中需要达到的最低样本量,本研究中为332。
图7为此次样本量估算整个过程的详细参数设置汇总。
五、结论
已知身高平均值与其置信限的距离(容许误差)为0.6cm,总体标准差为5.0cm。若取检验水准0.05,则置信度为0.95,要使得样本身高可以代表全校所有男生身高水平,至少需要298例研究对象。若考虑10%的脱失率,则至少需要332例研究对象。