诊断试验准确性研究报告标准(Standards forReporting of Diagnostic Accuracy, STARD)——解读(上)

2023年8月3日星期四发布于 15:00:52 浏览：2986

原创不易，转载请注明来源，感谢！

在前面文章中介绍了诊断试验准确性研究报告标准(Standards for Reporting of Diagnostic Accuracy, STARD)的背景、条目清单和使用注意事项。我们将分三篇文章对STARD条目进行解读，本文将解读【条目1~9】内容。

关键词：加强观察性流行病学研究报告质量; 观察性研究; 诊断试验准确性研究; 报告规范; 诊断试验准确性研究报告标准; STARD

一、标题或摘要

【条目1】标题或摘要中描述出至少一种诊断准确性研究的计算方法(如灵敏度、特异度、预测值、或AUC)

【解读】MEDLINE和Embase等生物医学电子数据库是检索生物医学主题相关研究不可或缺的资源。为了便于读者检索和获取信息，作者应在标题或摘要中明确标识本研究为诊断试验准确性(diagnostic test accuracy, DTA)研究。可以通过使用相关术语，如“灵敏度”、“特异性”、“阳性预测值”、“阴性预测值”、“ROC曲线下面积(AUC)”以及“似然比”等。

1991年MEDLINE数据库通过使用“灵敏度和特异度”等关键词来检索诊断试验准确性研究。然而，该检索方式仅能识别到不到51%的诊断试验准确性研究。截至2015年5月，Embase的词库(Emtree)有38个研究类型的检查标签，其中包括“诊断试验准确性研究”。但该检索标签在2011年才被引入使用。

二、摘要

【条目2】包括研究设计、方法、结果和结论在内的结构化摘要(具体指导参见STARD 摘要)

【解读】摘要阅读是读者判断是否需要检索和精读完整研究报告的重要方式，特别是在无法获取完整研究报告或时间有限的情况下，临床决策几乎是基于摘要中提供的信息。研究调查发现，在高影响力期刊或国际科学会议上发表的诊断准确性研究的摘要信息不足的原因主要是研究问题、研究方法、研究结果及研究结果的含义等关键信息缺失。因此，报道性摘要应提供足够信息，帮助读者快速评估研究效度(偏倚风险)和研究结果在其临床环境中的适用性(外推性)的关键因素。为更满足读者要求，结构化摘要应包括针对性的目的、方法、结果及结论，以便于读者更容易找到必要的信息。具体指导参见STARD摘要。

三、引言

【条目3】科学和临床背景，包括待评价诊断方法的预期用途和作用

【解读】在引言中，作者应描述其研究的背景和原因。参考以前的研究报道可揭示其中的不确定性以及存在的不足。明确定义待评价诊断方法的预期用途和作用将有助于研究设计，以及确立灵敏度和特异度等目标指标，同时还有利于读者评估研究的含义。诊断试验的预期用途包括筛查、诊断、分期、监测、预后、治疗选择或其他目的。明确诊断试验的临床作用有助于评估待评价试验产生潜在错误的相对重要性。例如：一种旨在排除疾病的诊断试验需要非常高的灵敏性，而一种旨在确诊疾病的诊断试验则需要较高的特异性。

【条目4】研究目的和假设

【解读】临床研究除了研究目的外(包括长期目标和具体目标)，还需有可验证的假设。在诊断准确性研究中，统计学假设通常是根据单个检验的可接受标准来定义，这种情况下，假设通常包括诊断参数值期望的定量表达。而在比较两个或多个诊断指标时，统计假设通常用等效性或非劣效性来定义。当拒绝原假设时，表明研究结论支持研究者的预设，即研究结果实现了研究的预期目标。在这种情况下，从统计学角度可认为是一项“成功的研究”，反之亦然。因此，明确的研究假设可有效避免研究者为了得到“成功”的研究结果，对研究结论进行“夸大解读”。

四、方法

(一) 研究对象

【条目5】是在完成待评价诊断方法和参考标准检测之前采集数据(前瞻性研究)，还是之后(回顾性研究)？

【解读】在文献中，术语“前瞻性”和“回顾性”的定义和使用场景存在很大差异。因此，有必要清楚地描述数据收集是在待评价诊断试验和标准参考试验实施之前还是之后进行的。如果作者在进行待评价诊断试验和标准参考试验实施之前定义的研究问题，那么他们则可根据研究方案优化程序和数据收集方式。这种前瞻性的数据收集方式能够有效控制数据质量。相反，如果数据收集在待评价试验和标准参考试验之后进行，则数据收集依赖患者病历。这种回顾性数据收集的研究可能比前瞻性研究更好地反映常规临床实践，但它可能无法识别所有符合条件的患者，这往往会导致数据质量较低，缺失数据较多的问题，难以保证高质量的数据。

【条目6】入选排除标准

【解读】诊断准确性研究旨在反映特定环境下的表现，因此研究报告应明确描述目标人群入选标准。这些入选标准通常包括可疑体征、症状或具有前期诊断结果的人群。在考虑安全性、可行性和伦理因素时，还可使用其他标准来排除研究对象。但需要注意的是，排除患有特定疾病或对检测方式产生副作用的患者，可能会导致诊断准确性被过高估计。在队列研究中，对所有研究者使用相同的诊断标准；而在病例对照研究中，需要对病例组和对照组分别采用不同的诊断标准。

【条目7】如何识别潜在的合格研究对象(症状、之前的检查结果、注册登记数据库)

【解读】在研究中，纳入标准明确了符合研究目的的研究对象的要求，但没有描述研究者如何识别合格的研究对象。在实际操作中，识别潜在的合格研究对象有多种方式。例如，全科医生可以评估每一个病人在就医期间的情况，以评估是否满足入选标准；研究人员可以通过急诊科登记记录以确定潜在的研究对象。一些研究是从接受了待评价试验之后才被识别为患者，一些研究是从参考标准试验开始就被识别为患者，还有一些回顾性研究是基于医院数据库中接受参考标准试验和待评价试验来识别潜在的合格对象。确定合格患者方法的差异会影响研究组中目标人群的疾病谱和患病率，以及没有目标疾病患者的其他健康状态的情况和频率。这些差异可能会影响诊断准确性的估计。

【条目8】何时、何地入选潜在的合格研究对象(机构、场所和日期)

【解读】诊断准确性研究结果反映的是某个试验在某特定的临床背景和环境下的表现，例如一项医学试验在不同级别的医疗环境(如初级医疗机构和二级、三级医疗机构)中的结果会存在差异。因此，作者应报告进行研究的实际环境及确切位置，包括试验实施的地点名称、城市和国家等信息。由于诊断程序、转诊机制以及疾病严重程度和流行强度会随着时间的推移而演变，作者还应报告招募参与者的起止日期。这些信息将有益于读者评估研究结果的普遍性，对特定问题适用的读者，还有助于做出正确的临床诊疗决策。

【条目9】研究对象是否连续的、随机的入组还是选取方便样本

【解读】研究对象可以以连续入组的方式进行纳入研究，即在研究地点进行合格性评估后满足入选标准的所有患者均被纳入研究，也可以是这些患者中的一个子集。这个子集样本的选择可能是通过随机数字表随机化产生，也可能是非随机化产生。然而，如果仅选择特定时间段的患者入组，则这种非随机化方式纳入的受试者可能不能代表目标人群，这将影响研究结果的外推性。

注：本文内容是参考相关文献后对STARD报告规范原文的解读，仅代表本网站观点。关于STARD声明的更多信息详见STARD官网(http://www.stard-statement.org/)或EQUATOR协作网(https://www.equator-network.org/reporting-guidelines/stard/)、(https://www.equator-network.org/reporting-guidelines/stard-abstracts/)进行查询，或Patrick M Bossuyt等发表的论文“STARD 2015: an updated list of essential items for reporting diagnostic accuracy studies (https://pubmed.ncbi.nlm.nih.gov/26511519/)”、Jérémie F Cohen等发表的论文“STARD 2015 guidelines for reporting diagnostic accuracy studies: explanation and elaboration(https://pubmed.ncbi.nlm.nih.gov/28137831/)”、Jérémie F Cohen等发表的论文“STARD for Abstracts: essential items for reporting diagnostic accuracy studies in journal or conference abstracts (https://pubmed.ncbi.nlm.nih.gov/28819063/)”、朱一丹等发表的论文“诊断准确性研究报告规范(STARD) 2015介绍与解读(http://www.cjebm.com/article/10.7507/1672-2531.20160112)”。

我要纠错

End

诊断试验准确性研究报告标准(Standards for Reporting of Diagnostic Accuracy, STARD)——概述

诊断试验准确性研究报告标准(Standards forReporting of Diagnostic Accuracy, STARD)——解读(中)