关键词:诊断试验; 灵敏度; 特异度; 截断值选择; ROC曲线; 正确指数
一、灵敏度和特异度的定义
在前面文章中详细介绍了灵敏度和特异度的概念及计算方法(诊断试验评价——真实性评价)。灵敏度(sensiticity)是指一项诊断试验能将实际患病的人正确诊断为患者的能力,特异度(specificity)是指一项诊断试验能将实际无病的人正确诊断为非患者的能力。
表1
根据四格表(表1)信息,其计算公式分别为:
灵敏度(Se) = \(\frac{a}{a+c} \times 100 \%\)
特异度(Sp) = \(\frac{d}{b+d} \times 100 \%\)
通过灵敏度和特异度的定义可知,一个诊断试验要做到灵敏度和特异度最优,就需要既能诊断出足够多的真正患病人群,也能诊断出足够多的实际无病人群。基于这样的研究理念,在实际诊疗过程中应该如何确定一个科学合理的界值(也称为截点、截断值),以很好地区分患者和非患者呢?
二、截断值的选取
(一) 场景一:正常人与患者独立双峰分布
新生儿苯丙酮尿症(PKU)是一种发病率极低(低于万分之一)的疾病,正常新生儿苯丙氨酸含量的分布范围为23~120µmol/L,患儿的分布范围为128~3281µmol/L,二者分布无交叉,此时可将截断值设置为绝大多数(99.9%)新生儿的上限(120µmol/L)便可将正常群体和患者区分开。
类似新生儿PKU这类发病率极低的疾病,若总人群中指标呈独立双峰分布,正常人与患者的值分布曲线完全无重叠,原则上只需要将截断值设置在患者最小值或正常人最大值,即可很容易地将正常人和患者区分开来。由于实际检测中很难绝对精确地计算总体正常人的最大值或总体患者最小值,因此通常做法可根据正常人群检测值的99%~99.9%置信区间的上限来确定截断值。此时的灵敏度和特异度均可无限接近100%。四格表可整理如表2所示。
表2
(二) 场景二:正常人与患者交叉重叠分布
场景一这种完美的理想状态在实际临床实践中毕竟比较少见。更多疾病诊断指标在正常人和患者之间的分布是存在部分交叉的,如高血压患者的血压值(图2),此时科学合理的截断值可通过理论结合临床实际,综合选取。
- 当设置高血压患者的最低血压值为截断值时(截断值1),血压大于截断值的就诊者将被诊断为“异常”(高血压),此时所有患者将被正确诊断为高血压,灵敏度可达100%,漏诊率为0。但有相当一部分正常人也会被错误的诊断为高血压患者(称为假阳性),即特异度较低,误诊率较高。这种做法较为适合疾病预后较差,漏诊后果严重,且目前已存在一定的治疗措施,可以很好的对患者进行诊疗的情形;研究者只需尽可能的保证灵敏度,及时发现可疑患者并进行进一步判别诊断。
- 当设置正常人群的最高血压值为截断值时(截断值3),血压小于截断值的就诊者将被诊断为“正常”(非患者),此时所有正常人将被正确诊断为非患者,特异度可达100%,误诊率为0。但有相当一部分真正的高血压患者会被错误的诊断为“正常”(称为假阴性),即灵敏度较低,漏诊率较高。这种做法较为适合疾病的诊疗效果欠佳,尚无较为有效的治疗措施的情形;为避免患者的心理负担和精神压力,研究者需尽可能保证特异度,鉴别出更多的正常人群。
- 当设置高血压患者的最低血压值和正常人群的最高血压值中间数值时(如截断值2),可在一定程度上避免误诊率和漏诊率过高,但却不能达到灵敏度或特异度为100%。此时较为适合灵敏度和特异度同等重要,二者需保持有效平衡的诊断场景。
(二) 场景三:正常人与患者完全重叠单峰分布
该场景中患者被正常人所包含,如图3所示,此时截断值的选取或多或少都会造成假阳性的发生,因此需重点避免漏诊的发生。研究者可根据患者分布是否离散以及分布拐点,合理选择如图所示的截断值作为针对目标疾病的初筛方法或更换其他诊断方法。
三、受试者工作特征曲线
在实际操作过程中,研究者往往会使用受试者工作特征(ROC)曲线来作为灵敏度与特异度之间变化关系的可视化展示。ROC曲线的横坐标为“1-特异度”,纵坐标为“灵敏度”,是诊断试验准确性的综合体现。
如图4所示,灵敏度和特异度之间的变化趋势为:随着“1-特异度”的增加(特异度降低),灵敏度的变化趋势是先快后慢,直至趋于平缓,这表明灵敏度增加到一定程度时,继续提升较少增幅的灵敏度,将会损失较大降幅的特异度。因此,灵敏度与特异度之间是不可调和的增减问题,研究者需根据临床实际合理均衡选择二者。
在ROC曲线上,研究者往往选取曲线左上角的点为最佳的截断值点,此时所对应的灵敏度和特异度均相对最优。虽然这种方式简单易懂,但是左上角的点在图上却很难准确的找出,可以结合正确指数(也称约登指数)作为最佳截断值的定量评价。公式如下:
正确指数= (灵敏度+特异度)-1 =灵敏度-(1-特异度)
此时,正确指数就可以准确的反应出ROC曲线纵横坐标之间的变化关系。随着灵敏度和特异度的变化,正确指数取值最大时,就是ROC曲线的左上角最佳截断值点。
四、灵敏度与特异度的选取
在实际诊断试验的实施过程中,往往不能简单地根据ROC曲线和正确指数以及正常和异常患者的分布做截断值的选取,还需要考虑针对诊断阳性患者及阴性患者所开展的后续处理,从疾病预后、治疗措施、诊疗费用、医疗政策等方面综合地选取较为合理的截断值。
- 当疾病早期诊断可获得较好治疗效果,一旦漏诊将造成较为严重的不可逆损害时,往往倾向于发现更多的可能阳性患者,即便是导致部分假阳性率的增加。此时,可以提高灵敏度,降低特异度。如乳腺癌的早期筛查,应尽可能地发现更多可疑患者,以进一步确诊和早期治疗。
- 当疾病目前并无较好的治疗方案,且误诊会给患者带来巨大的心理压力和精神负担,往往倾向于降低误诊率,即便是导致部分漏诊率增加。此时,可以提高特异度,降低灵敏度。如胰腺癌等恶性程度较高的癌症诊断,此时已无有效的诊疗手段可以改善患者预后,且治疗费用昂贵,应尽可能地发现更多的非患者,降低误诊率。
- 当然,针对假阳性的患者需进一步采用其他诊断试验进行鉴别,若进一步的鉴别诊断费用较高,所需医疗资源较多,往往为有效降低患者医疗成本和避免医疗资源浪费,可选择性的适度提高特异度,降低灵敏度,将假阳性率控制在适当范围之内,进而达到合理的动态平衡。
- 此外,如果研究者认为灵敏度和特异度同样的重要,则可以考虑选择将截断值选取在一个适中的位置(如图2,曲线交叉处)。
灵敏度和特异度的选择,与患者获益密切相关,研究者应综合考虑实际诊疗需求,选择合适的截断值。