诊断试验(diagnostic test)是指应用各种临床试验、医疗仪器等手段对就诊者进行检查,通过分析就诊者的检查结果来诊断或鉴别疾病状况的试验。诊断试验可用于评估目标试验(待评价试验)对疾病或健康状况的诊断效果。诊断试验准确性研究报告标准(Standards for Reporting of Diagnostic Accuracy, STARD)的目标是通过建立一个科学、规范、循证的报告指南,以提高诊断试验准确性研究的报告质量,使读者能够通过完整、准确的报告来评估研究结果的内部真实性(潜在偏倚)和外部真实性(适用性)。本文主要介绍STARD的背景、条目清单和使用注意事项。
诊断试验(diagnostic test)是指应用各种临床试验、医疗仪器等手段对就诊者进行检查,通过分析就诊者的检查结果来诊断或鉴别疾病状况的试验。诊断试验准确性(diagnostic test accuracy, DTA)研究是评价诊断试验证据准确性的研究方法,一般通过比较同一群研究对象的诊断试验结果和金标准(https://mengte.online/archives/5642)结果来评价诊断试验的效能。随着医学技术的快速发展,特别是分子生物学技术的进步,新的诊断技术不断涌现;然而,诊断试验的研究与准确性评价相对滞后,尤其在方法学方面远远落后于实验室研究。因此,如何准确、科学地评估诊断试验对目标疾病的诊断效能尤为重要。
许多研究由于设计缺陷可能会高估DTA,导致在尚不成熟的情况下将诊断试验应用于临床,进而可能误导临床诊疗决策。因此,在将诊断试验用于临床之前,应对DTA研究的设计、实施、数据分析和结果等信息报告完整性和规范性、潜在偏倚和适用性进行严格评价,以评估其结果的可推广性。2000年9月,在荷兰阿姆斯特丹举行的共识会议上,诊断试验准确性研究报告标准(Standards for Reporting of Diagnostic Accuracy, STARD)指导委员会制定了STARD声明。该声明包括1个由25个条目组成的清单,1个反映研究设计和研究对象流程的流程图以及1个解释性文件。STARD声明在2015年进行了更新,更新版本共包括标题或摘要、引言、方法、结果、讨论、其他信息6个部分,涵盖了30个条目。STARD声明已经成为国际上关于DTA研究报告的权威指南。
(一) STARD条目清单
表1 诊断试验准确性研究STARD 2015条目清单中英文对照
内容 | 条目序号 | 条目内容 |
Title or abstract 标题或摘要 | 1 | Identification as a study of diagnostic accuracy using at least one measure of accuracy (such as sensitivity, specificity, predictive values or AUC) 标题或摘要中描述出至少一种诊断准确性研究的计算方法(如灵敏度、特异度、预测值、或AUC) |
Abstract 摘要 | 2 | Structured summary of study design, methods, results and conclusions (for specific guidance, see STARD for Abstracts,链接) 包括研究设计、方法、结果和结论在内的结构化摘要(具体指导参见STARD 摘要,链接) |
Introduction 引言 | 3 | Scientific and clinical background, including the intended use and clinical role of the index test 科学和临床背景,包括待评价诊断方法的预期用途和作用 |
4 | Study objectives and hypotheses 研究目的和假设 | |
Methods 方法 | ||
Study design 研究设计 | 5 | Whether data collection was planned before the index test and reference standard were performed (prospective study) or after (retrospective study) 是在完成待评价诊断方法和参考标准检测之前采集数据(前瞻性研究),还是之后(回顾性研究)? |
Participants 研究对象 | 6 | Eligibility criteria 入选排除标准 |
7 | On what basis potentially eligible participants were identified (such as symptoms, results from previous tests, inclusion in registry) 如何识别潜在的合格研究对象(症状、之前的检查结果、注册登记数据库) | |
8 | Where and when potentially eligible participants were identified (setting, location and dates) 何时、何地入选潜在的合格研究对象(机构、场所和日期) | |
9 | Whether participants formed a consecutive, random or convenience series 研究对象是否连续的、随机的入组还是选取方便样本 | |
Test methods 试验方法 | 10a | Index test, in sufficient detail to allow replication 充分描述待评价诊断方法的细节,使其具备可重复性 |
10b | Reference standard, in sufficient detail to allow replication 充分描述参考标准的细节,使其具备可重复性 | |
11 | Rationale for choosing the reference standard (if alternatives exist) 选择参考标准的原理(如果存在其他备选的参考标准) | |
12a | Definition of and rationale for test positivity cut-offs or result categories of the index test, distinguishing prespecified from exploratory 描述待评价诊断方法的最佳截断值或结果分类的定义和原理,区分截断值是否为预先设定的还是探索性的 | |
12b | Definition of and rationale for test positivity cut-offs or result categories of the reference standard, distinguishing prespecified from exploratory 描述参考标准的最佳截断值或结果分类的定义和原理,区分截断值是否为预先设定的还是探索性的 | |
13a | Whether clinical information and reference standard results were available to the performers or readers of the index test 待评价诊断方法的检测人员或读取结果人员是否知晓研究对象的临床资料和参考标准结果 | |
13b | Whether clinical information and index test results were available to the assessors of the reference standard 参考标准的评估者是否知晓研究对象的临床资料和待评价诊断方法结果 | |
Analysis 方法 | 14 | Methods for estimating or comparing measures of diagnostic accuracy 用于评估诊断准确性的计算或比较方法 |
15 | How indeterminate index test or reference standard results were handled 如何处理待评价诊断方法或参考标准的不确定结果 | |
16 | How missing data on the index test and reference standard were handled 待评价诊断方法或参考标准中缺失数据的处理方法 | |
17 | Any analyses of variability in diagnostic accuracy, distinguishing prespecified from exploratory 任何关于诊断准确性变异的分析,区分是否为预先设定的还是探索性的 | |
18 | Intended sample size and how it was determined 预期样本量及其计算方式 | |
Results 结果 | ||
Participants 研究对象 | 19 | Flow of participants, using a diagram 使用流程图报告研究对象的入选和诊断流程 |
20 | Baseline demographic and clinical characteristics of participants 报告研究对象的基线人口学信息和临床特征 | |
21a | Distribution of severity of disease in those with the target condition 报告纳入的研究对象的疾病严重程度分布 | |
21b | Distribution of alternative diagnoses in those without the target condition 报告未纳入的研究对象的疾病严重程度分布 | |
22 | Time interval and any clinical interventions between index test and reference standard 报告实施待评价诊断方法和参考标准的时间间隔,及期间采取的任何临床干预措施 | |
Test results 试验结果 | 23 | Cross tabulation of the index test results (or their distribution) by the results of the reference standard 比照参考标准的结果,使用四格表来展示待评价诊断方法的检测结果(或分布) |
24 | Estimates of diagnostic accuracy and their precision (such as 95% CIs) 报告诊断准确性的估计结果及其精度(如95%置信区间) | |
25 | Any adverse events from performing the index test or the reference standard 报告实施待评价诊断方法或参考标准期间出现的任何不良事件 | |
Discussion 讨论 | 26 | Study limitations, including sources of potential bias, statistical uncertainty and generalisability 研究的局限性,包括潜在的偏倚来源,统计的不确定性及外推性 |
27 | Implications for practice, including the intended use and clinical role of the index test 实际意义,包括待评价诊断方法的预期用途和临床作用 | |
Other information 其他信息 | 28 | Registration number and name of registry 研究注册号及注册机构名称 |
29 | Where the full study protocol can be accessed 能够获取完整研究方案的地址 | |
30 | Sources of funding and other support; role of funders 研究经费和其他支持的来源;经费赞助者的角色 |
(二) 诊断试验准确性研究流程图

图1 诊断试验准确性研究流程图(英文)

图1 诊断试验准确性研究流程图(中文)
(三) 诊断试验准确性研究报告摘要
表2 诊断试验准确性研究STARD摘要条目清单中英文对照
条目 | 条目内容 |
Title 标题 | Identification as a study of diagnostic accuracy using at least one measure of accuracy (such as sensitivity, specificity, predictive values or AUC) 标题中至少描述一种诊断准确性研究的评价指标(如灵敏度、特异度、预测值、或AUC) |
Background and Objectives 背景和目标 | Study objectives 研究目的 |
Methods 方法 | Data collection: whether this was a prospective or retrospective study 数据收集:是前瞻性研究还是回顾性研究? |
Eligibility criteria for participants and settings where the data were collected 研究对象的纳入排除标准和数据收集的机构场所 | |
Whether participants formed a consecutive, random, or convenience series 研究对象是否连续的、随机的入组还是选取方便样本 | |
Description of the index test and reference standard 描述待评价诊断方法和标准检测方法 | |
Results 结果 | Number of participants with and without the target condition included in the analysis 分析过程中纳入的,有、无目标疾病的受试者数量 |
Estimates of diagnostic accuracy and their precision (such as 95% confidence intervals) 诊断准确性及其精确性的估计值(如95%置信区间) | |
Discussion 讨论 | General interpretation of the results 结果的一般解释 |
Implications for practice, including the intended use of the index test 实际意义,包括待评价诊断方法的预期用途和临床作用 | |
Registration 注册 | Registration number and name of registry 研究注册号及注册机构名称 |
注:本文内容是参考相关文献后对STARD报告规范原文的概述,仅代表本网站观点。关于STARD声明的更多信息详见STARD官网(http://www.stard-statement.org/)或EQUATOR协作网(https://www.equator-network.org/reporting-guidelines/stard/)、(https://www.equator-network.org/reporting-guidelines/stard-abstracts/)进行查询,或Patrick M Bossuyt等发表的论文“STARD 2015: an updated list of essential items for reporting diagnostic accuracy studies (https://pubmed.ncbi.nlm.nih.gov/26511519/)”、Jérémie F Cohen等发表的论文“STARD 2015 guidelines for reporting diagnostic accuracy studies: explanation and elaboration(https://pubmed.ncbi.nlm.nih.gov/28137831/)”、Jérémie F Cohen等发表的论文“STARD for Abstracts: essential items for reporting diagnostic accuracy studies in journal or conference abstracts (https://pubmed.ncbi.nlm.nih.gov/28819063/)”、朱一丹等发表的论文“诊断准确性研究报告规范(STARD) 2015介绍与解读(http://www.cjebm.com/article/10.7507/1672-2531.20160112)”。