关键词:样本量计算; PASS; 诊断试验; ROC曲线; 置信区间
ROC曲线,又称为受试者工作特征曲线,是在横轴为1-特异度,纵轴为灵敏度的坐标系上绘制的工作曲线,它由所有观察值作为诊断界点求得的1-特异度和灵敏度在坐标上的描点连接而成。ROC曲线下面积置信区间样本量估具体计算过程及注意事项如下。
一、案例数据
某研究者欲采用ROC曲线下面积来评价某诊断试验诊断价值,拟构建ROC曲线下面积的双侧95%置信区间。假设ROC曲线下面积为0.7,希望置信区间宽度不得高于0.15,试估计所需的样本量?
二、案例分析
本研究是基于ROC曲线下面积这一指标来评诊断试验的诊断价值,拟构建ROC曲线下面积双侧95%置信区间,则其样本量计算需要以下几个参数:
1. ROC曲线下面积,本例取0.7
2. 置信区间宽度,即上置信限(UCL)和下置信限(LCL)之间的距离,该值常介于0~1之间,本例取0.15
3. 检验水准α (常取0.01至0.1),本例取0.05
4. 脱失率(DR,通常不宜超过20%),本例取10%
三、软件操作
(一) 方法选择
在左侧界面中依次选择“Procedures (程序)”—“ROC (ROC曲线,也可称受试者工作特征曲线)”—“Confidence Intervals for the Area Under an ROC Curve (ROC曲线下面积的置信区间)”,见图1。
(二) 参数设置
在“Design (设置)”模块中按以下参数设置相应选项(图2):
- Solve For:选择“Sample Size”,表示分析的目的是计算样本量。
- One-Side or Two-Sided Interval:“Interval Type”表示置信区间的类型,可选择“Two-Sided(双侧检验)”、“Upper One-Sided(上单侧检验)”和“Upper One-Sided(下单侧检验)”。本例选择“Two-Sided”。
- Confidence:“Confidence Level(1-Alpha)”表示置信水平,本例为0.95
- Sample Size:“Group Allocation”表示研究对象如何分配到不同组别,本例选择“Equal(N1=N2)”对照组和处理组样本量相等。
- Precision:“Confidence Interval Width”表示置信区间宽度,即上置信限UCL和下置信限LCL之间的距离,本例为0.15。
- Area Under ROC Curve:“AUC(Area Under ROC Curve)”表示诊断试验ROC曲线下面积,AUC介于0.5~1.0之间,本例为0.7。
(三) 脱失率设置
在“Reports (结果报告)”模块中,勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”,在“Dropout Rate”中填10(图3),表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。
四、结果及解释
图4列出了该研究设计的相关参数和样本量计算结果,研究对象186例,其中处理组与对照组相等,即N1=N2=93。
图5“References (参考文献)”列出了该计算过程中参考的相关文献;“Report Definitions (报告定义)”列出了各个参数的具体解释;“Summary Statements (报告概述)”为整个分析报告的摘要。
图6“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N'),也是研究实际开展过程中需要达到的最低样本量,本研究中为208,其中处理组与对照组相等,即N1=N2=104。
图7为此次样本量估算整个过程的详细参数设置汇总。
五、结论
本研究是基于ROC曲线下面积评价诊断试验的价值,拟通过构建ROC曲线下面积双侧95%置信区间。已知ROC曲线下面积为0.7,希望ROC曲线下面积的置信区间宽度不得高于0.15,则至少需要186例研究对象,对照组与处理组例数相等,即N1=N2=93。若考虑10%的脱失率,则至少需要208例研究对象,对照组与处理组例数相等,即N1=N2=104。