一、案例数据
某研究者设计了一份小学生营养膳食食谱,声称可让90%的小学生营养摄取量达标。某地共有10000名小学生,该地教育局在引进该食谱前考察该食谱的效果,希望所选样本达标率可以代表10000名小学生的水平,估计误差不超过3%(置信区间上下限之差为6%),试估计所需的样本含量。
二、案例分析
本研究中,总体数量有限,已知置信区间计算单样本比例的样本量仍可采用有限总体置信区间法,需要以下几个参数:
- 总体数量N,本例为10000。
- 指定的容许误差d,本例中为0.03。
- 检验水准α (通常取0.01至0.1,本研究取0.05)。
- 置信度/可信度CL(即1-α,常用0.95或0.99,本研究取0.95)。
- 预计样本比例值,本例中为0.9。
- 脱失率DR (通常不宜超过20%,本研究取10%)。
三、软件操作
(一) 方法选择
在左侧界面中依次选择“Procedures (程序)”—“Proportions (比例)”—“One Proportion (单样本比例)”—“ Confidence Interval (置信区间法)”—“Confidence Intervals for One Proportion from a Finite Population (置信区间法检验来自有限总体的单样本比例)”,见图1。
(二) 参数设置
在“Design (设置)”模块中按以下参数设置相应选项(图2):
- Solve For: 选择“Sample Size”,表示本分析的目的是用于计算样本量。
- N(Population Size): 即总体数量N,填“10000”。
- P(Sample Proportion): 表示预期的样本比例的大小,此处填“0.9”。
- d (Precision, Half Width): d为容许误差,是双侧置信区间宽度的一半,此处填“0.03”。
- Confidence Level: 表示置信度CL,即为1-α,填写“0.95”。
(三) 脱失率设置
在“Reports (结果报告)”模块中,勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”,在“Dropout Rate”中填写“10%”(图3),表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。
四、结果及解释
图4列出了该研究设计的相关参数和样本量计算结果,可知计算的样本例数(N)为370。
图5“References (参考文献)”列出了该计算过程中参考的相关文献;“Report Definitions (报告定义)”列出了各个参数的具体解释;“Summary Statements (报告概述)”为整个分析报告的摘要。
图6“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N'),也是研究实际开展过程中需要达到的最低样本量,本研究中为412。
图7为此次样本量估算整个过程的详细参数设置汇总。
五、结论
该案例为单样本比例的置信区间法计算样本量,已知某地小学生总数为10000,预期小学生的营养摄入达标率(样本比例的估计值)为0.9,预期的容许误差为0.03。若取检验水准0.05,则置信度为0.95,要使得所选有限样本达标率可以代表所有学生水平,至少需要370例研究对象。若考虑10%的脱失率,则至少需要412例研究对象。