关键词:样本量计算; PASS; 相关分析; Kappa一致性检验; Kappa系数
一、案例数据
某医院两位放射科医生通过观察胸片及其他资料对一批尘肺病人的临床分期进行诊断,现使用Kappa检验评估两人诊断的一致性。根据既往研究可知,尘肺Ⅰ期、Ⅱ期、Ⅲ期病人占比分别为0.5、0.3、0.2,预期的Kappa系数为0.85,为检验系数是否大于0.7,取α=0.05,β =0.1,试估计所需的样本含量。
二、案例分析
本研究中欲评估两个医生诊断结果的一致性,采用两个评分者一致性的Kappa检验,其样本量计算需要以下几个参数:
1. 两个评分者分配到每个类别的对象比例,本例中为0.5、0.3、0.2。
2. 原假设H0下的κ0,本例为0.7。
3. 备择假设H1下的κ1,本例为0.85。
4. 检验水准α (通常取0.01至0.1,本研究取0.05)。
5. 检验功效1-β (通常为0.8或更高,本研究取0.9)。
5. 脱失率DR (通常不宜超过20%,本研究取10%)。
三、软件操作
(一) 方法选择
在左侧界面中依次选择“Procedures (程序)”—“Correlation (相关)”—“Kappa Raters Agreement (评分一致性Kappa检验)”—“Kappa Test for Agreement Between Two Raters (两个评分者一致性的Kappa检验)”,见图1。
(二) 参数设置
在“Design (设置)”模块中按以下参数设置相应选项(图2):
①Solve For:选择“Sample Size”,表示本分析的目的是用于计算样本量。
②Alternative Hypothesis:指定备择假设的单双侧及假设检验的方向。选择“One-Sided(H1:κ1>κ0)”,表示进行备择假设为H1:κ1>κ0的上单侧检验。
③Power and Alpha:Power为把握度,填写“0.90”;Alpha为检验水准,填写“0.05”。
④κ1 (Kappa|H1):即备择假设H1下的κ1,范围介于-1~1,若采用单侧检验,则κ1与κ0的关系应与假设检验的方向对应。本例填“0.85”。
⑤κ0 (Kappa|H0):即原假设H0下的κ0,范围介于-1~1,若采用单侧检验,则κ1与κ0的关系应与假设检验的方向对应。本例填“0.7”。
⑥Specify Using:选择用于指定边际分类频率的方法。包括【List Input】直接指定一组数据分类频率、【Spreadsheet Column Input】使用电子表格指定多组频率。本例选择前者。
⑦P(Frequencies):指定两个或多个边际分类频率、比例。指研究对象被评分级别的构成比例。本例填写“0.5 0.3 0.2”。
(三) 脱失率设置
在“Reports (结果报告)”模块中,勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”,在“Dropout Rate”中填写“10%”(图3),表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。
四、结果及解释
图4列出了该研究设计的相关参数和样本量计算结果,可知计算的样本例数(N)为125,即两位放射科医生至少需要对125例尘肺病人各评估一次。
图5“References (参考文献)”列出了该计算过程中参考的相关文献;“Report Definitions (报告定义)”列出了各个参数的具体解释;“Summary Statements (报告概述)”为整个分析报告的摘要。
图6“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N'),也是研究实际开展过程中需要达到的最低样本量,本研究中为139,即两位放射科医生至少需要对139例尘肺病人各评估一次。
图7为此次样本量估算整个过程的详细参数设置汇总。
五、结论
本研究由两位医生(评分者)在一定数量的尘肺病人中进行分期诊断,为检验两者诊断结果的一致性,可通过Kappa系数的大小进行评估。为检验系数是否大于0.7,已知既往尘肺Ⅰ期、Ⅱ期、Ⅲ期病人的构成比分别为0.5、0.3、0.2,预期Kappa一致性系数κ为0.85,若取检验水准0.05、检验功效0.90,则两位医生至少需要对125例尘肺病人各评估一次。若考虑10%的脱失率,则两位医生至少需要对139例尘肺病人各评估一次。