临床预测模型文献解读——呼吸系统代表性文献:肺结核治疗不成功的临床预测模型(上)

发布于 2023年8月13日 星期日 17:27:06 浏览:1803
原创不易,转载请注明来源,感谢!

预测模型目前已运用至临床各学科,本文选择了呼吸系统相关疾病肺结核治疗不成功的临床预测模型进行解读。文献来源于Lauren S. Peetluk等发表的A Clinical Prediction Model for Unsuccessful Pulmonary Tuberculosis Treatment Outcomes (https://pubmed.ncbi.nlm.nih.gov/34214166/)。我们首先根据Transparent Reporting of a Multivariable Prediction Model for Individual Prognosis or Diagnosis (TRIPOD)提供的Checklist对该案例进行详细解读,其后使用PROBAST: A Tool to Assess the Risk of Bias and Applicability of Prediction Model Studies (评估预测模型研究偏倚风险和适用性的工具)对该研究的偏倚风险和适用性进行评价。

关键词:临床预测模型; 诊断模型; 预后模型; 报告规范; TRIPOD; 偏倚风险; 适用性

本文根据TRIPD (即针对个体预后或诊断的多因素预测模型报告规范,简称:临床预测模型报告规范)条目清单中的【条目1~9】对案例文献进行解读。

一、标题和摘要

(一) 标题

【条目1明确研究为建立和/或验证一个多因素预测模型,以及目标人群和预测的结局指标

【解读】文章在标题中指出该研究是临床预测模型研究,所预测的结局为肺结核治疗不成功(图1)。然而,在标题中未写明是仅建立预测模型,或是仅验证已有的预测模型,或者是先建立模型之后再进行验证(如内部验证、外部验证),再或者是已有预测模型的更新及验证等。根据文章正文内容可知,该研究首先是建立一个预后模型,然后进行Bootstrap内部验证;而且,还考察了一些预测因子的预测价值增量,以及对前人开发的模型(Costa-Veiga model)进行外部验证。另外,文章未指出研究的目标人群,虽然读者能根据肺结核治疗不成功这些关键词大致明白研究目标人群是肺结核患者,但不够明确,比如可能是肺结核初治者、一线药耐者等。

根据临床预测模型报告规范,建议在拟定标题时包含以下信息:①使用预测模型(Prediction model)、预后模型(Prognostic model)、诊断模型(Diagnostic model)、风险评分(Risk score)、风险分层模型(Risk stratification model)以及预测、预后、风险、诊断等词汇表明该研究是预测模型研究,以及预测模型的类型(预后模型或诊断模型);②使用建立/开发(Establishment/Development)、内部验证(Internal validation)、外部验证(External validation)、时间验证(Temporal validation)、空间验证(Geographic validation)、领域验证(Domain validation)、更新(Update)、预测因子增量(Incremental value)等词汇来说明预测模型研究的类型;③说明研究所面向的目标人群,可写明是某病患者或者健康人群,或更详细一些(如具有某特征的亚组人群);④写明研究或模型预测的结局变量。另外,作者需要注意的是,在拟定标题时要满足期刊对文章标题字数/词数的要求。

图1

(二) 摘要

【条目2】概述研究目的、研究设计、研究现场、研究对象、样本量、预测因子、结局、统计分析方法、结果和结论

【解读】文章使用结构化摘要(背景、方法、结果和结论)进行了概述(图2)。如背景中所述,该研究的目的是使用基线临床特征开发一个预测肺结核治疗不成功的预测模型,同时评估HIV相关变量与异烟肼乙酰化状态(NAT2)对所建立模型的增量。方法中指出数据来源于巴西肺结核区域前瞻性队列(the Regional Prospective Observational Research for Tuberculosis Brazil cohort, RePORT-Brazil),说明了该研究是基于前瞻性队列研究,研究现场是在巴西;研究对象是2015年-2019年RePORT-Brazil纳入的新诊断为肺结核的患者,同时提到了纳入标准:痰培养确诊的、使用一线抗结核药且药物敏感、随访时间≥12月;给出了预测结局指标为肺结核治疗不成功,并给出了该复合结局的组成成分:死亡、治疗失败、改变治疗方案、未完成治疗、未评估。摘要部分提到了样本量为944例,结局事件为191例。对于统计分析方法,给出了预测因子筛选的方法(bootstrapped backward selection),对模型进行bootstrap内部验证,通过shrinkage factor改善预测,通过区分度和校准度对模型进行评价,以及对预测因子增量是否有意义的检验方法等,但未说明该模型是基于哪一种统计模型或机器学习算法,也未直接说明数据集如何划分或者有无外部验证集。

在摘要的结果部分作者给出了模型最终纳入的7个预测因子,预测模型的区分度评价指标C统计量为0.77 (95%CI: 0.73-0.80),校准度较好(乐观校正截距和斜率分别为-0.12和0.89),将HIV相关变量与异烟肼乙酰化状态加入预测模型后,未明显改善原模型的预测能力。该研究最终的结论是利用治疗开始时可获得的患者信息建立的预测模型,其预测能力在该人群中表现良好。研究结果或许可指导未来的工作,以合理分配医疗资源或告知卫生服务提供者对高危患者施加有针对性的干预措施。

图2

二、前言

【条目3a】背景:解释医学背景(包括是诊断模型,还是预后模型)和建立或验证多因素预测模型的根本原因,以及对现有预测模型的参考

【解读】文章在背景部分详细解释了开展本研究的背景,构建模型的原因,以及概述了现有相关预测模型的情况(图3-1)。肺结核是全球人口主要死因之一。虽然,目前已经有很多有效的药物和治疗方案,肺结核患者也能普遍得到治疗;但是,WHO估计仍有15%的肺结核患者治疗会不成功。巴西是一个肺结核高疾病负担的国家,据巴西国家结核病计划法定传染病信息系统的数据显示仅67%的肺结核患者治疗成功,即有33%的肺结核患者治疗不成功,远低于终结肺结核计划要求的2025年要达到90%治疗成功率的目标水平。

如果医生和研究者能及时、准确地获知肺结核初治者将来治疗不成功的风险值/概率,以识别最有可能治疗不成功的患者,则可以采取有效措施(如加强治疗或干预策略)提高治疗成功率,从而改善该人群的整体治疗效果。而临床预测模型便是一种可以综合个体相关信息进行结局概率预测的方法/工具。一项系统综述对既往发表的肺结核治疗结局预测模型进行了评价,发现均有研究偏倚和报告不规范的情况存在。鉴于巴西肺结核高疾病负担和现有预测模型实用性差的现状,有必要开发一个适用于巴西肺结核初治者治疗不成功的临床预测模型。

图3-1

【条目3b】详细说明研究目的,包括该研究是预测模型的开发,还是验证,或两者兼有

【解读】文章指出,该研究的目的是开发一个预测肺结核初治者治疗不成功风险的临床预测模型,并对其进行内部验证;其次,考虑到HIV感染和异烟肼乙酰化对肺结核治疗结局的影响,将两者加入到临床预测模型中,评估其所带来的预测能力的增量(图3-2)。

图3-2

三、研究方法

(一) 数据来源

【条目4a】分别描述训练集和验证集的研究设计或数据来源,例如,随机试验、队列研究或登记研究的数据 (如适用)

【解读】该研究的数据来源于巴西区域肺结核前瞻性队列研究(RePORT-Brazil),该队列研究在巴西3个地区的5个研究中心(里约热内卢州有3个、萨尔瓦多市有1个、玛瑙斯市有1个)开展(图4)。

【条目4b】指出关键研究日期,包括开始日期、结束日期;如适用,给出随访结束日期

【解读】在5个研究中心,研究对象均于2015年6月至2019年6月期间连续入组,并且有效随访至2020年6月(图4)。

图4

(二) 研究对象

【条目5a】描述研究现场/场景的关键要素(如,初级医疗机构、二级医疗机构或普通人群),包括研究中心的数量和地点

【解读】RePORT-Brazil的研究对象来自里约热内卢州的伊文德罗·查加斯国家传染病研究所、Rinaldo Delmare健康诊所、卡西亚斯公爵市卫生秘书处,萨尔瓦多的巴西结核病研究所和玛瑙斯市的海特·维埃拉·杜拉多博士热带医学基金会收治的肺结核患者(图5)。

【条目5b】描述研究对象的纳入和排除标准

【解读】本研究报告了研究对象的纳入标准,即RePORT-Brazil的纳入标准:①年龄≥18岁;②新诊断的痰涂片阳性的肺结核患者;③对肺结核治疗药物敏感;④确诊后7天内接受标准一线抗肺结核药物治疗。排除标准为:①在入组30天内接受抗结核治疗≥7天;②入组30天内接受氟喹诺酮类药物治疗>7天;③孕妇或哺乳期的女性;④随访期间不在本地者。见图5。

【条目5c】如与模型有关,请详细说明研究对象所接受的治疗/干预

【解读】作者在study design and population中提到,研究对象所接受的标准一线抗结核治疗包括异烟肼、利福平或利福丁、吡嗪酰胺和乙胺丁醇治疗2个月,随后异烟肼和利福平治疗4个月。同时作者将《巴西结核病控制建议手册》(Manual de Recomendações para o Controle da Tuberculose no Brasil)作为参考文献进行了引用,也方便读者通过该手册进一步了解巴西的标准一线抗结核治疗方法(图5)。

图5

(三) 结局指标

【条目6a】明确定义预测模型预测的结局指标,包括评价的方法和时间

【解读】如作者在文中所述,根据WHO的相关定义,肺结核患者的治疗结局有治愈、完成治疗、治疗失败、全因死亡、治疗不完整和未评估共6种互斥的情况,并在Table 1中给出了每种治疗结局的定义。其中,治愈和完成治疗被归类为治疗成功,即本研究的参照结局;治疗失败、全因死亡、治疗不完整和未评估归类为治疗不成功,即本研究的兴趣结局(图6-1、图6-2)。

图6-1
图6-2

【条目6b】报告对结局指标进行盲法评价的细则

【解读】文章未提及结局指标盲法评价的相关内容。由于本研究中的所有结局指标均有明确的定义,且均为客观指标,所以未进行盲法评价或测量,对结果的影响较小。

(四) 预测因子

【条目7a】明确定义所有的候选预测因子,包括测量/评价的方法和时间

【解读】候选预测因子的选择参考了Peetluk LS等对肺结核预测模型的系统综述(Systematic review of prediction models for pulmonary tuberculosis treatment outcomes in adults)中的预测因子和合作者的临床经验,包括15个基线预测因子:年龄、性别、自报告的种族、接受正规教育的年数、BMI、结核病既往史、胸片显示的空洞、涂片阳性、HIV感染、糖尿病、血红蛋白、慢性病、吸烟、吸毒、酒精滥用,以及NAT2乙酰化状态。每个预测因子均给出了相应的定义,以表格的形式展示在文章补充数据的补充文件2(Supplementary File 2. Definitions of predictors)中(图7-1、图7-2)。

图7-1
图7-2

【条目7b】报告对预测因子进行盲法测量/评价的细则

【解读】文章未提及预测因子盲法评价的相关内容。

(五) 样本量

【条目8】描述样本量是如何估算的

【解读】作者介绍到,根据Riley RD等有关预测模型样本量计算的方法(Riley RD, Ensor J, Snell KIE, et al. Calculating the sample size required for developing a clinical prediction model. BMJ 2020; 368:m441.),该研究拟纳入12-21个候选预测因子,兴趣结局的发生率为20%,估计需要710~1242的样本量才能达到足够的预测精度。而本研究的样本量为944例,作者认为现有数据能够满足建模的需求(图8)。

此处作者并未解释的很清楚,虽然引用了Riley RD等预测模型样本量计算方法的文献,但未明确指出是采用了其中的计算公式计算出的样本量区间(最小值为710,最大值为1242)。若的确是根据Riley RD等的研究结果计算了样本量,且最大样本量为1242,那么作者应以最大样本量1242为准,而目前仅944例,样本量并未满足建模的需求。另外,在Riley RD等的样本量计算方法中,使用的是候选预测因子的参数,即预测因子对应的回归系数的个数,而不是预测因子的个数。详见Riley RD等人的文章。

图8

(六) 数据缺失

【条目9】描述处理数据缺失的方法(如,完整案例分析、单一填补、多重填补)及细节

【解读】通过多重填补法对预测因子的缺失值进行了10次填补,得到10个填补后数据集;通过取连续变量的中位数和分类变量的众数对10个填补后的数据集进行综合,汇总成1个完整数据集进行后续的分析(图9)。

对于文章中的处理方式,笔者认为与多重填补法的流程不符。多重填补法是一个完整的数据处理与统计分析流程,包括根据相应的统计模型或机器学习算法填补出n个完整的数据集,在n个完整的数据集上分别进行统计分析得到n套结果,然后将n套统计分析结果汇总为1套。而该研究是将多个填补数据集综合为1个,再进行主分析。正是考虑到被填补缺失值的不确定性,多重填补法才对一个缺失值进行多次不同数值的填补,以形成多个完整的数据集;简单地将多个完整数据集综合为1个,违背了多重填补的不确定性思想。

另外,作者还采用了完整案例法,即剔除有缺失值的研究对象,然后进行模型的建立与验证作为敏感性分析;而且,还在多重填补得到的10个数据集中分别进行模型的预测因子筛选、建立与验证,同样作为一种敏感性分析。

图9

关于TRIPOD声明的更多内容,详见Moons KG等作者发表的文章“Transparent Reporting of a multivariable prediction model for Individual Prognosis or Diagnosis (TRIPOD): explanation and elaboration (https://pubmed.ncbi.nlm.nih.gov/25560730/)”,曹煜隆等作者发表的文章“个体预后与诊断预测模型研究报告规范——TRIPOD声明解读(http://www.cjebm.com/article/10.7507/1672-2531.201912032)”。关于PROBAST偏倚风险评价的更多内容,详见Wolff RF等作者发表的文章“PROBAST: A Tool to Assess the Risk of Bias and Applicability of Prediction Model Studies (https://pubmed.ncbi.nlm.nih.gov/30596875/)”,陈茹等作者发表的文章“预测模型研究的偏倚风险和适用性评估工具解读 (http://chinaepi.icdc.cn/zhlxbx/ch/reader/view_abstract.aspx?file_no=20200530&flag=1)”。

End
文章目录 沉浸式阅读