关键词:诊断试验; 多变量综合诊断; logistic回归; L评分
在多变量综合诊断分析的知识小贴士中提到,logistic回归模型需要通过将就诊者各参数信息代入公式后计算得到Logit(P),再通过与模型截断值比较,做出是否患病的判断。本文便介绍该方法的具体运用。
一、案例简述
某课题组通过就诊者的基本特征、实验室检查等多个指标构建了评价该就诊者是否患病的logistic回归模型为:Logit(P) = -4.068 + 1.617×年龄(60岁以下=0,60岁及以上=1) + 1.935×是否吸烟(不吸烟=0,吸烟=1)+ 0.420×肿瘤标志物A。现欲探索如何将该模型便捷地用于临床诊断。构建模型时共纳入424例就诊者,包括就诊者的年龄(60岁以下=0,60岁及以上=1)、是否吸烟、是否饮酒、肿瘤标志物A;肺癌诊断的金标准为穿刺活检病理检查(非肺癌=0,肺癌=1)。部分数据见图1,本文案例可从“附件下载”处下载。
表1
二、问题分析
本案例的研究目的是将综合诊断模型便捷地应用于临床诊断,可以将模型简化得到L评分计算公式,利用该公式计算原始数据中每位就诊者的L评分,然后进行ROC分析找到模型最优时对应的L评分,即截断值,后面只要通过计算就诊者的L评分就可以进行疾病诊断。
三、软件操作及结果解读
(一) 计算L评分
1.软件操作
从(提高诊断试验效率:多变量综合诊断——SPSS软件实现,链接)中得到诊断“是否患肺癌”的危险得分Logit(P) = -4.068 + 1.617×年龄(60岁以下=0,60岁及以上=1) + 1.935×是否吸烟(不吸烟=0,吸烟=1)+ 0.420×肿瘤标志物A。为了便于应用,可以把模型系数同时除以一个可以让模型变简单的数值(一般选择除以最小的系数),Logit(P)变为L评分,本例中除以0.42,得到L评分= -9.7 + 3.9×年龄(60岁以下=0,60岁及以上=1) + 4.6×是否吸烟(不吸烟=0,吸烟=1) +肿瘤标志物A。如果原危险得分公式已经很简单易算,此步骤可以省去,直接将Logit(P)计算公式作为L评分的计算公式。
然后将所有参与模型构建的就诊者年龄(60岁以下=0,60岁及以上=1)、是否吸烟情况和肿瘤标志物A数据代入L评分计算公式,得到新变量“L评分”,具体操作如下:
- 点击“转换”—“计算变量”(图2)。
- 在“计算变量”对话框进行L评分的计算:“目标变量”下录入生成的新变量名称“L评分”,右侧数字表达式中录入L评分的计算公式:“-9.7 + 3.9 * age + 4.6 * smoking+ marker_A”,然后点击“确定”(图3)。
2.结果解读
在“数据视图”中可以看到新生成变量“L评分”(图4)。
(二) 确定截断值
通过ROC曲线可以选择最佳的诊断截断值,ROC曲线越靠近左上角,试验的准确性就越高。
1.软件操作
- 选择“分析”—“分类”—“ROC曲线”(图5)。
- 在“ROC曲线”对话框中,“检验变量”中选择“L评分”,“状态变量”中选择“金标准诊断结果”,并将其下方的“状态变量值”设为“1”。在下方“显示”部分全部勾选,最后点击“确定”(图6)。
2.结果解读
图7是通过“L评分”生成的ROC曲线。
图8显示ROC曲线下面积为0.860 (95%CI:0.823~0.896)。
图9是不同L评分下的“敏感度”(一般写为“灵敏度”)和“1-特异性”(一般写为“特异度”),即ROC曲线上的坐标点。
要想获得诊断截断值,首先要计算约登指数(又称为正确指数,Youden index),约登指数越高,该诊断方法发现真正病人与非病人的能力越强。约登指数=灵敏度+特异度-1=灵敏度-(1-特异度),可以将图9中数值复制到Excel表中进行计算,然后对算出的约登指数做降序排列,找到约登指数最大为0.586,此时对应的点就是图7曲线中最接近左上角(1.0,1.0)的点,此时灵敏度为0.730,特异度为1-0.144=0.856,L评分为2.715,即为通过L评分诊断就诊者是否患病的截断值(图10)。
(三) 模型应用
由以上分析结果可知,当L评分<2.715时,可以认为该就诊者未患病,当L评分>2.715时,可以认为该就诊者患病。假设临床中遇到1位就诊者,其年龄为45岁,有吸烟史,肿瘤标志物A的数值为7。则该就诊者的L评分= -9.7 + 3.9×0 + 4.6×1 + 7 = 1.9 < 2.715,因此可以诊断该就诊者未患病,即可快速实现模型的应用。
四、结论
通过对综合诊断分析得到的logistic回归模型进行简化,得到L评分= -9.7 + 3.9×年龄(60岁以下=0,60岁及以上=1) + 4.6×是否吸烟(不吸烟=0,吸烟=1) + 肿瘤标志物A。将案例中所有就诊者的年龄(60岁以下=0,60岁及以上=1)、是否吸烟和肿瘤标志物A的数据代入该公式可以计算得到L评分。通过L评分的ROC曲线分析,得到曲线下面积为0.860 (95%CI:0.823~0.896),也得到每个L评分对应的曲线上坐标(“敏感度”和“1-特异性”),通过坐标值计算得到约登指数最大为0.586,对应L评分为2.715。
综上,只要根据就诊者的年龄、是否吸烟及肿瘤标志物A算出的L评分>2.715,就诊断为该就诊者患病;若L评分<2.715,可认为该就诊者未患病。这种诊断方法的灵敏度为0.730,特异度为0.856。