关键词:加强观察性流行病学研究报告质量; 观察性研究; 遗传风险预测研究; 报告规范; 加强遗传风险预测研究报告质量声明; GRIPS
一、标题和摘要
【条目1a】通过标题可识别该文章为遗传因素风险预测研究
【条目1b】摘要中使用推荐的关键词:遗传或基因组学;风险;预测
【解读】为了提高文章的可识别性和检索几率,建议作者在标题、摘要和医学主题词(MeSH术语)中注意以下关键词:“遗传”(或“基因组”)、“风险”和“预测”,以明确此报告为遗传风险预测的研究。这三个关键词的顺序和组合没有严格要求。如果报告以遗传风险预测为主要目的,则建议作者在标题中提及关键词。关键词“遗传”或“基因组”的使用尤其重要,因为遗传变异种类繁多,如染色体、SNP、单倍型或拷贝数变异。如果作者只使用特定的术语,而不涵盖宽泛描述,如“遗传变异”,可能导致难以检索到相关研究。当风险预测并非研究的主要目的,例如在全基因组关联研究中的预测分析部分,同样需要使用上述关键词。为确保报告的正确检索,作者还应该在摘要中提到预测分析。MeSH术语是将一篇文章确定为遗传风险预测研究的另一个方法,并为促进未来研究的综合评价提供便利。我们建议关于这一主题的研究至少使用MeSH术语“疾病的遗传易感性”、“风险评估”和“测试的预测价值”。这三个术语类似于关键词“遗传”、“风险”和“预测”,能进一步明确和准确地描述该报告的研究内容。。
二、引言
【条目2】解释科学背景和预测研究的依据
【解读】背景部分,应该向读者介绍有关本研究主题的现有研究现状,以及本研究在理论研究层面的合理性。相关背景信息应包括但不限于以下两个主题:首先,阐明遗传因素在本研究结果中的作用,特别是涉及纳入预测模型的遗传变异。这包括已经发现的基因变异数量和可能观察到的效应大小的范围等内容。其次,应介绍现有可用的风险预测模型,并说明这些模型对研究的参考价值,包括基于较少遗传变异、相同变异、非遗传风险因素或遗传和非遗传因素组合的模型。对这些风险模型的性能进行评价,可为所研究的风险模型的评价提供参考价值。当提供了关于研究可比性的基本信息时,与早期研究的比较是最有帮助的。这些信息可能包括环境细节以及被调查人口的年龄、性别和种族。然而,对于某些主题,系统性总结这些信息将需要对大量文献进行系统综述,远远超出了大多数研究论文的典型简短介绍篇幅。因此,我们建议作者应简明扼要地回顾当前主题的风险研究现状,以及当前研究是如何在现有证据的基础上提出的。
【条目3】阐述研究目的和具体模型。描述该研究内容是否为模型的构建、模型的验证或二者兼有
【解读】对于遗传风险预测研究,在研究目的部分应具体说明在哪种人群和环境中研究哪种模型以预测哪种结果。此外,作者应该说明报告是否涉及新风险模型的开发(如果是,是否执行了某种内部或外部验证),或者关于早期模型的复制或验证。最后,应报告是否存在预先计划或者事后的亚组分析和交互作用分析,如果是,应详细描述。
三、方法
(一) 研究设计/现场环境
【条目4】阐明研究设计的关键要素,描述研究现场、具体场所、相关时间范围,包括研究对象征集、随访和数据收集时间
【解读】研究设计的关键因素包括:研究设计类型、研究现场和具体场所。常见的研究设计类型主要有队列研究、横断面研究或病例对照研究。而研究现场则是指招募研究对象的途径,例如通过医院、门诊诊所、筛查中心或登记处等方式。具体场则指涉及到的国家、地区和城市等信息。在遗传风险预测模型研究中,尤其是诊断方法(如成像和生物标志物的使用)以及基因型和其他风险因素评估发生变化的背景下,应强调数据收集日期和随访持续时间的区别及其之间的逻辑关联。研究人员还应说明数据是针对本研究重新收集的,还是使用以前收集的数据进行的二次分析。使用既往研究进行二次分析的数据得出的研究结论可能存在一些局限性,包括但不限于没有评估相关数据或存在特殊的人口特征。
(二) 研究对象
【条目5】描述研究对象的纳入排除标准、来源和选择方法
【解读】风险模型的预测性能可能会受到被测试人群的影响,因此最好通过从有疾病或结果风险的人群中随机抽取样本进行评估。为此,需要在研究报告中详细描述参与者的资格标准、来源和选择方法,以说明测试的假定目标人群以及研究人群的代表性。在评估研究结果的有效性和外部推广性时,是研究对象的纳入标准和排除标准是重要的判断标准之一。这些标准应具体说明特征,如年龄、性别、血统、种族和/或地理区域,。对于病例对照研究,还包括诊断和合并症等信息。另外,研究对象的来源也需要明确,即从哪些参与者中选择样本以及选择方法是随机招募的还是自行选择的。此外,诊断标准在研究报告中也应该清楚描述,如果有公认的疾病诊断标准也应该说明。
对于队列研究和横断面研究,应明确招募研究对象的人口基数,例如来自一般人群、特定地区或医院。队列研究的受试者纳入标准应考虑年龄、性别、种族、特定风险因素、诊断、病程或阶段以及合并症;而病例对照研究应指定用于选择病例的(诊断)标准和选择对照的标准。这些标准的清晰描述有助于了解所涉及的疾病范围。病例对照研究有时会将非常严重的病例与非常健康的对照进行比较,特别是先前收集的数据主要目的是为了发现该种基因时。这种严格的招募标准是基因发现的有效策略,但与未选择人群的评估相比,预测性能可能会被高估,因为对照组可能有早期症状或疾病风险因素。此外,对于病例对照研究,需要明确病例和对照是否匹配以及如何匹配,因为过度匹配可能会影响样本中该因素相对于其在未匹配人群中的预测能力。
(三) 研究变量
【条目6】定义:明确定义所有纳入研究对象的特征、危险因素和结局。采用广泛使用的系统命名法来定义遗传变异
【解读】所有参与者的特征,遗传和非遗传风险因素,以及在分析中考虑和使用的结果,都应明确定义和描述。疾病结局应参照已建立的诊断标准或研究所需的特定标准来确定,并说明理由,同时应明确遗传和非遗传风险因素的选择过程。作者应详细说明是否包括所有已知的危险因素,如果没有,应阐明理由。在描述遗传变异时,应使用普遍通用的术语。当考虑替代(替代位点)时,应该量化与预期位点的相关性,例如R2。当通过填补测算(imputation)获得变量时,应描述填补方法和参考数据库,并对填补质量进行评估。
【条目7a】评价:描述数据来源以及对每个研究变量的测量方法
【条目7b】评价:详细描述基因型检测方法和其他实验室方法
【解读】除了变量的选择和定义外,用于评估的来源和方法也会影响研究的质量。在评估质量时,重要的质量问题主要包括潜在的危险因素和结果的错误分类,以及基因分型的准确性。数据来源一般指的是谁收集数据以及如何收集数据。具体来说,数据是由研究医师收集的还是由受过训练的学生收集的?问卷是通过访谈完成的还是基于自我报告的?基因分型是在室内进行的还是由专门的实验室进行的?评估方法是指所使用的具体技术或问卷。如果以前已经发表过方法,请提供参考依据。对于用于测量生物标记物的实验室程序,应详细描述以便其他人能够执行它们并评估包括它们的预测模型的外部可推广性。对于不太广泛使用的评估,如研究人员自己开发的调查问卷和程序,作者应该报告有关评估质量的有效性和可靠性信息。当基线和随访使用不同的评估时(例如,由研究医生进行的基线评估,从全科医生的医疗记录中获得的随访评估),这些评估应加以解释。同时,如果存在结果仲裁程序时(例如,中心化团队根据外围中心的当地调查员提供的信息对结果进行仲裁),应介绍该过程的细节和相关信息。。
【条目8a】编码:描述分析基因变异的方法
【条目8b】编码:解释分析中定量变量的处理方法。如果可能,描述其分类方法和理由
【解读】在遗传危险因素的分析中,可采用多种方法有很。例如,回归模型可分为显性遗传或隐性遗传模型,遗传变异可为等位基因(采用加法模型或对数加法模型)或基因型。另外,回归模型的自变量也可采用综合遗传危险因素的遗传风险评分。当使用风险评分时,作者应该解释哪些等位基因或基因型被认为是风险变异。遗传变异编码的描述应该使其他研究人员能够重复分析,以验证或更新风险模型。定量变量可以连续处理,也可以分类处理。当变量和结果之间的关系不是线性时,可能需要进行转换,并且应该指明转换方法。应解释用于分类的基本原理和阈值,特别是当它们与临床或流行病学研究的常用截断值不同时。
(四) 分析
【条目9】模型构建:详述构建风险模型的过程和所用数据。阐明备选变量的选择方法和其他模型构建有关问题。阐明风险预测的时间跨度(如5年风险)
【解读】在构建风险模型的过程中,由于具有灵活性,作者需要解释为何以及如何构建模型,以及使用了哪些数据。这些解释包括对条目6中定义的变量的说明,这些变量是最初考虑的,并且在最终选择中遵循了哪些程序(例如,向前选择变量或向后删除变量,以及纳入和删除的标准)。此外,还应包括对纳入分析的研究对象的说明,如果与总研究人群不同,变量的转换,统计模型的选择(例如,logistic或Cox比例风险模型),以及模型中预测因子之间相互作用效应的处理(见条目13)。对于亚组构建单独模型的基本原理,例如,为不同的种族群体,或在总人口模型中包括分层变量作为预测因子或相互作用效应,应详细说明。作者还应该详细说明和解释风险预测的范围,例如,在队列研究中模型预测的是五年还是终生风险。对于使用统计方法(如正则化回归或支持向量)开发更复杂的风险预测模型时,应该对这些模型进行足够详细的解释和说明,以便其他人可以在其他数据集中实现这些模型。对于一些更复杂的“黑盒”模型(例如随机森林),这可能需要有最终模型的软件来实现。所使用数据的描述应包括是否选择了来自构建模型的人群,该人群是如何选择的,以及在队列研究中如何处理审查数据。一些研究的目的只是验证和进一步应用一个已经存在的模型。在这种情况下,应该简单地说明使用了先前的模型,并适当参考了先前的研究或开发该模型的研究,并对其特征进行了简洁的描述。
【条目10】有效性验证:详述验证风险模型的步骤和所用数据
【解读】与在独立人群中进行评估相比,在同一人群中进行风险模型评估通常会更容易得出阳性的结论。因此,验证风险模型,在另一个数据集中重新评估模型的性能是模型评估的重要组成部分,特别是当模型的开发具有将其应用于医疗保健的特定意图时。验证主要有两种类型:同一总体中的内部验证或独立样本中的外部验证。内部验证防止对模型的预测性能做出过于乐观的评估,但是它无法证明模型在其他人群中的表现。此外,许多标准的内部验证方法,如交叉验证,即使正确使用仍然可能高估模型分类的准确性。作者应该报告是否执行了(内部或外部)验证,并描述验证过程的过程。对于内部验证,作者应该描述人群的哪一部分被用于构建风险模型,哪一部分被用于验证,以及他们是否使用交叉验证和bootstrap重抽样技术。对于外部验证,他们应该描述用于验证的人群,特别是与用于构建风险模型的人群的可比性。如果该模型在以前的研究中已经得到了验证,那么也应该说明这一点。
【条目11】缺失数据:说明缺失数据处理方法
【解读】在观察性研究中,数据缺失是不可避免的。作者应具体说明其数据中缺失值的百分比,指出是否有理论或经验依据认为缺失可能是非随机的,并具体说明在分析中如何处理缺失数据。作者应该详细说明用于处理缺失数据的方法(例如,完整病例分析,填补测算,重新加权)和基于这种选择的假设。假设可能包括数据的分布,以及数据是否完全随机缺失,或与其他变量或研究结果有关。
【条目12】统计方法:详述所有风险模型的评估方法,包括但不限于模型拟合和预测能力的评价方法
【解读】对风险预测模型的全面评估至少包括以下两个方面:(1)模型与基础数据的拟合程度;(2)模型的预测能力。在方法部分,应该清楚地描述使用哪些测量方法来回答哪些问题。模型拟合的度量(也称为校准)包括Hosmer Lemeshow统计量、R2、对数似然比和赤池信息准则(AIC),预测能力的度量(也称为判别度量)包括ROC特征曲线下面积(AUC)、判别斜率和Brier评分。这些测量可以附有图表和表格,包括校准图、风险分布图、AUC图、判别图和预测曲线等。所使用方法的描述还应阐明所采用的不确定度度量(例如,95%置信区间),并具体说明用于确定发现统计显著性的检验方法。当报告P值时,作者应指出本假设检验具有统计显著性的P值阈值。当比较两个风险模型,其中一个是另一个的扩展版本时,风险模型的评估包括每个模型的上述两个方面。通过AUC或判别斜率的增加(称为综合判别改进,IDI)提供了简单的方法来评估一种模型相对于另一种模型的改进。最近有研究还基于分类表计算再分类优化差值(net reclassification improvement,NRI)评估了风险模型的改进。当使用风险类别时(例如,再分类表测量计算时),应提出临界值的基本原理,并适当参考先前的工作,表明这是一个标准选择;或者为选择的临界值提供适当的理由。
【条目13】描述所有亚组、交互作用和探索性分析
【解读】对于预测性能的评估,可能存在风险模型比初始研究人群表现更好的亚组,并且可能存在共同对疾病风险产生更大影响的遗传变异。然而,进行大量的亚组或相互作用探索性分析会增加偶然发现或统计学显著的可能性。因此,作者不仅应描述进行的所有额外的亚组分析,还应指出这些分析是基于先验的临床或流行病学证据计划的,还是以探索性的方式进行的。同样,作者还应解释是否考虑了交互效应,如果考虑了,是考虑了哪些,为什么以及如何在最终模型中进行选择(见条目9)。这些描述应包括用于防止结果过度解释的任何方法,例如多重检验的P值校正。亚组和交互作用分析计划应在研究背景中进行报告(见条目3);探索性分析可在方法的部分进行报告。
注:本文内容是参考相关文献后对GRIPS报告规范原文的解读,仅代表本网站观点。关于加强GRIPS报告质量声明的更多信息详见EQUATOR协作网(https://www.equator-network.org/reporting-guidelines/strengthening-the-reporting-of-genetic-risk-prediction-studies-the-grips-statement/)进行查询,或阅读A Cecile J W Janssens等发表的文章“Strengthening the Reporting of Genetic Risk Prediction Studies: The GRIPS Statement (https://pubmed.ncbi.nlm.nih.gov/21423587/)”、A Cecile J W Janssens等发表的文章“Strengthening the reporting of genetic risk predictionstudies (GRIPS): explanation and elaboration (https://pubmed.ncbi.nlm.nih.gov/21407270/)”。