医学研究之单样本定量资料样本量计算——百分位数置信区间法

发布于 2021年10月10日 星期日 20:28:06 浏览:2712
原创不易,转载请注明来源,感谢!

前面介绍了“医学研究之单样本定量资料样本量计算——容许概率法”,即为固定容许概率的置信区间法,本文介绍正态分布资料的百分位数置信区间法(Confidence Intervals for a Percentile of a Normal Distribution)样本量估计,具体计算过程及注意事项如下。

一、案例数据

对某社区60岁以上老年女性人群的血清总胆固醇含量进行检测,假设血清总胆固醇含量标准差为0.65mmol/L,为估计该社区60岁以上老年女性人群的血清总胆固醇含量的P90的95%CI,期望置信区间宽度不超过0.8mmol/L,试估计所需的样本含量。

二、案例分析

血清总胆固醇数值为连续性资料,根据既往科学研究,人体血清总胆固醇水平服从正态分布,且本案例中样本为随机样本,因此满足单样本t检验的要求。

本研究中,计算单样本平均值的样本量可采用百分位数置信区间法,需要以下几个参数:

  1. 指定的百分位数P,本例中为P90
  2. 指定的置信区间宽度W,本例为0.8。
  3. 检验水准α (通常取0.01至0.1,本例取0.05)。
  4. 置信度/可信度CL(即1-α,常用0.95或0.99,本例取0.95)。
  5. 样本标准差σ,本例中为0.65。
  6. 脱失率DR (通常不宜超过20%,本例取10%)。

三、软件操作

(一) 方法选择

在左侧界面中依次选择“Procedures (程序)”—“Means (均值)”—“One Mean (单样本均值)”—“ Confidence Interval (置信区间法)”—“ Confidence Intervals for a Percentile of a Normal Distribution (正态分布资料的百分位数置信区间法)”,见图1。

图1

(二) 参数设置

在“Design (设置)”模块中按以下参数设置相应选项(图2):

  1. Solve For: 选择“Sample Size”,表示本分析的目的是用于计算样本量。
  2. Interval Type: 选择“Two-Sided”,表示使用双侧置信区间。
  3. Confidence Level(1-Alpha):表示置信度CL,即为1-α,填写“0.95”。
  4. Width of Confidence Interval:表示置信区间宽度W,即样本百分位数到上、下置信限间的距离,应为正数,本例填“0.8”。
  5. Percentile Percentage:即百分位数的百分位,本例填“90”。
  6. Standard Deviation: S(Standard Deviation)表示样本标准差,填“0.65”。
图2

(三) 脱失率设置

在“Reports (结果报告)”模块中,勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”,在“Dropout Rate”中填写“10%”(图3),表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。

图3

四、结果及解释

图4列出了该研究设计的相关参数和样本量计算结果,可知计算的样本例数(N)为22。

图4

图5“References (参考文献)”列出了该计算过程中参考的相关文献;“Report Definitions (报告定义)”列出了各个参数的具体解释;“Summary Statements (报告概述)”为整个分析报告的摘要。

图5

图6“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N'),也是研究实际开展过程中需要达到的最低样本量,本研究中为25。

图6

图7为此次样本量估算整个过程的详细参数设置汇总。

图7

五、结论

已知该社区60岁以上老年女性人群的血清总胆固醇含量标准差为0.65mmol/L,置信区间宽度为0.8mmol/L,若取检验水准0.05,则置信度为0.95,欲估计90百分位的血清总胆固醇值,至少需要22例研究对象。若考虑10%的脱失率,则至少需要25例研究对象。

End
文章目录 沉浸式阅读