关键词:样本量计算; PASS; 相关分析; Kappa一致性检验; Kappa系数; Kappa值的置信区间
一、案例数据
某研究用红外扫描和X线摄片两种方法在同一批妇女中筛检乳腺癌。该研究希望两种方法估计Kappa值的双侧95%CI宽度不超过0.1,进行预试验的结果如图1。问至少需要使用红外扫描法和X线摄片法检查多少妇女?
二、案例分析
欲研究两种检查方法检查结果的一致性,Kappa值的双侧95%CI宽度不超过0.1,宜采用Kappa值的置信区间法。利用Kappa值的置信区间进行样本量估算,需要以下几个参数:
1. 样本Kappa估计值。
2. Kappa值的标准差Sk。
3. 置信区间的宽度。
4. 检验水准α (通常取0.01至0.1,本例为0.05)。
5. 脱失率DR (通常不宜超过20%,本例取10%)。
三、软件操作
(一) 方法选择
在左侧界面中依次选择“Procedures (程序)”—“Correlation (相关)”—“Kappa Raters Agreement (评分一致性Kappa检验)”—“Confidence Intervals for Kappa (Kappa值的置信区间法)”见图2。
(二) 参数设置
在“Design (设置)”模块中按以下参数设置相应选项(图3):
① Solve For:“Sample Size”表示分析目的为计算样本量。
② One-Sided or Two-sided Interval:选择“Two-Sided”双侧检验。
③ Confidence:“Confidence Level (1-Alpha)”表示置信度,本例为“0.95”。
④ Precision:“Width of Confidence Interval”表示置信区间的宽度,本例填“0.1”。
⑤ Sample κ and SD(κ):“Specify κ and SD(κ) Using”指定或计算K估计值及K估计值的标准差Sk的方法,该选项包含四个选项“κ and SD(κ) of Cohen or Fleiss”、“κ and PO--Cohen’s SD(κ)”、“κ and Marginal Frequencies-Fleiss’s SD(κ)”和“Rater-by-Rater Frequency Table--Fleiss’s SD(κ)”,本例选择“Rater-by-Rater Frequency Table--Fleiss’s SD(κ)”指定评分者与评分者的列联表。将图1中四格表数据对应数值输入
中可自动计算K估计值及K估计值的标准差Sk(图4)。
对于本案例,在“Rater-by-Rater Frequency Table in Spreadsheet”下的“Spreadsheet Columns”中输入两种检测方法结果的2×2列联表,此处输入“=C1-C2”。点击右侧的
,在其中输入图1中四格表数据(图5)。
(三) 脱失率设置
在“Reports (结果报告)”模块中,勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”,在“Dropout Rate”中填写“10%”(图6),表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。
四、结果及解释
图7列出了该研究设计的相关参数和样本量计算结果,可知计算的样本例数(N)为5791,即至少需要红外扫描法和X线摄片法同时检查5791名妇女。
图8“References (参考文献)”列出了该计算过程中参考的相关文献;“Report Definitions (报告定义)”列出了各个参数的具体解释;“Summary Statements (报告概述)”为整个分析报告的摘要。
图9“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N'),也是研究实际开展过程中需要达到的最低样本量,本研究中为6435,即至少需要红外扫描法和X线摄片法同时检查6435名妇女。
图10为此次样本量估算整个过程的详细参数设置汇总。
五、结论
该案例为Kappa值的置信区间法计算样本含量。使用红外扫描和X线摄片两种方法在同一批妇女中筛检乳腺癌。该研究希望两种方法估计Kappa值的双侧95%CI宽度不超过0.1,前期相关试验结果如图1,则至少需要红外扫描法和X线摄片法同时检查5791名妇女。若考虑10%的脱失率,则至少需要用红外扫描法和X线摄片法同时检查6435名妇女。