关键词:加强观察性流行病学研究报告质量; 观察性研究; 肿瘤标志物; 报告规范; 肿瘤标志物预后研究报告规范; REMARK
二、材料和方法
(五) 统计分析方法
【条目10】详述所有的统计方法,包括变量选择过程和其他模型构建的问题细节,如模型假设的验证和缺失数据的处理方法等
【解读】应报告在分析中使用的所有统计方法,让读者了解所选择方法的原因,以评估结果。在分析开始之前,需要对数据进行初步准备,包括数据清洗(如数据的修改或删除)。首先,要了解标志物以及任何其他变量的数值分布,观察是否存在离群值或严重偏态。对于离群值,可以截断或省略。对于严重偏态,可对特定变量进行转换,例如对数变换或平方根变换。对于分类变量,可以合并频数较小的类别;对于其他变量,则可使用统计图形(例如箱式图)或统计量(例如平均数、中位数、标准差、全距、率)描述其分布。此外,还应描述标志物和其他变量的关联:在数据分析前期,应描述标志物之间或标志物与其他变量(例如既定的临床、病理和人口特征协变量)的关联,报告所使用的统计学方法(例如相关系数、卡方检验、t检验),并对极端或异常的关联予以关注。
在评估标志物与临床结局关联的单因素分析时,通常先在未调整其他变量时进行单因素分析。在此过程中,应报告分析方法(如t检验或Cox回归模型)、检验统计量(如t值或HR)的选择以及对变量的其他处理(如编码、分组或连续变量转换等)。研究其他变量与临床结局的关联也可用类似的分析。
多因素分析:作为多因素模型的估计,调整既有的预后变量后的标志物效应值,具有重大意义。建议在报告中尽量同时报告单因素及多因素分析方法的结果,便于比较调整前后的关联。此外,多因素分析也可用于构建涉及若干候选标志物的预测模型。通过严格评估模型的预测能力,避免过度拟合,使模型更具可靠性。分析多个变量时,也可采用其他统计方法(如分类和回归树以及人工神经网络)。
缺失数据:作者应报告每个相关变量的缺失值数量,给出缺失的原因并在描述研究人群的流程图中注明因为缺失数据而被排除的样本量。应报告任何处理缺失值的分析方法(如热卡填补、多重插补)及作出的假设(如随机缺失)等。
变量选择:报告变量选择的原则及其对应的变量纳入或排除标准。例如,当使用逐步回归法筛选生存预后的独立因素时,纳入变量采用前进法,纳入标准为P<0.05;剔除变量采用后退法,排除标准为P>0.05。
检验模型假设:所有统计模型都会对变量分布或变量间的关系做出特定的假设。应报告使用经验性方法进行模型的假设检验。
模型验证:“外部验证”是结果验证的最强证据,即用不参与原始分析的数据对结果进行确认。如果研究使用了外部验证,应该提供外部验证研究人群、设计和分析方法的基本细节。内部验证是指先将数据分为训练集和测试集两部分,在训练集上建立模型,然后在测试集上进行评估。对于内部验证,应描述所使用的验证算法(例如Bootstrap法、十折交叉验证或留一法交叉验证)。
【条目11】阐明分析中标志物数值是如何处理的;如有可能,描述用于确定截断值的方法
【解读】对于连续性变量,应报告是如何纳入分析的,是否对变量进行了数据变换(如对数转换,是线性或非线性建模以及如何建模的)。对于分类变量,应该报告所选择的分界点及原因。对于三个及以上的有序分类变量,应明确其处理方式。如果创建哑变量,需要明确哑变量的定义和分析方法。
三、结果
(一) 数据
【条目12】清楚描述整个研究过程中病人数量的变化情况,包括每个分析阶段纳入的病人数量以及退出的原因(建议使用流程图)。具体而言,无论是整体研究人群还是各亚组人群,都应清楚地报告相应的患者数量和事件发生数量
【解读】结构化描述是确保完整报告重要信息的关键方法之一。在预后研究概况的报告中,可使用两部分结构化报告模式:第一部分应报告感兴趣的肿瘤标志物的具体情况及其他变量。此外,还可以报告研究人群及其纳入和排除标准、纳入患者的数量及结局事件数量等一些其他重要信息。第二部分报告数据分析的基本情况。几乎所有关于预后肿瘤标志物的研究都应包括单因素、多因素及亚组分析。在某些情况下,需要报告几种多因素分析方法的结果。
【条目13】报告各变量的分布情况及其缺失值情况,包括基本的人口学特征(至少包括年龄和性别)、标准的预后变量(反应疾病特异性的)及肿瘤标志物
【解读】报告中应描述真正纳入研究的人群人口学特征(如性别、年龄、民族或种族等)、相关预后变量(例如病理分期信息包括淋巴结情况、肿瘤大小、是否转移或一些临床报告如体能状况等)及肿瘤标志物的分布情况。此外,某个变量缺失情况及全部变量数据都完整的病人数量均应予以报告。同时,尽可能比较研究人群与未纳入研究人群的人口学特征,以便读者评价结果的外推性。
(二) 分析和展示
【条目14】报告标志物与标准预后变量之间的关联
【解读】应报告标志物与传统预后变量的关联强度,这可正确评估标志物的效应。如果两者均为连续变量,可绘制散点图及进行相关性分析;如果数据中既有连续变量也有分类变量,则应在不同分类变量的类别下,分别报告连续变量检测值的箱式图、散点图和直方图,同时应避免对连续变量进行分类;如果数据中都是分类变量,可以采用交叉列联表展示标志物或其他标准变量的类别。这些描述性分析对多变量模型的解释及模型稳定性的评估都有很重要的作用。
【条目15】报告标志物与结局之间关联的单因素分析结果,以及相应的估计值(如风险比HR及生存概率)。最好也报告其他所有变量类似的分析结果。建议用Kaplan-Meier法分析标志物对时间-事件结局的影响
【解读】应先报告标志物与结局之间关联的单因素分析结果,即在未调整其他变量时标志物与结局的关联,这表明不考虑其他因素时这个肿瘤标志物的预后强度。对于临床终点是二分类变量的情况;当标志物是连续型变量时,应分别报告出现或未出现临床结局这两组间肿瘤标志物的均值;当标志物是分类变量时,研究者可以报告每组肿瘤标志物观察到的结局发生频率。对于时间-事件结局,可以用对数秩(log-rank)检验来描述其与标志物之间的关联。对于风险比估计(例如,来自Cox比例风险回归模型)或其他描述肿瘤标志物与生存时间之间的估计值,都需要进行报告,并且注明估计的统计信息(如置信区间、P值等);对于连续型的肿瘤标志物,可以报告未对肿瘤标志物进行分类时对结局的影响,若分类后进行分析,应报告分类方法。
【条目16】对于关键的多因素分析,至少需要在最终模型中,报告标志物及其他所有变量的估计值(如风险比HR)及相应的置信区间
【解读】通常情况下,多因素分析是通过逐步的变量筛选及建模过程得到一个更简约的“最终模型”。对于重要的多因素模型,特别是最终模型,应当报告模型中所有变量的置信区间及P值,以确定估计效应的精确度和显著性。如果多因素模型进行了重要的亚组分析(例如分别针对男、女的两个不同模型),每个亚组模型中的置信区间及P值也应报告。
【条目17】无论是否有统计学意义,在结果中都应报告标志物和标准预后变量的估计效应值及其置信区间
【解读】在评估新的肿瘤标志物与临床结局的关联时,通常需要考虑将标准预后变量纳入到模型分析中。这些标准变量可能是临床指南强烈推荐使用的,或者已经被证明具有预后价值,典型的标准变量包括疾病阶段及其构成元素(如肿瘤的大小和淋巴结状态),有时还包括基本资料如年龄或性别。在研究中,必须讨论和解释选择这些标准变量的原因。为了准确评估新的肿瘤标志物与临床结局的关联,可以采用“标准化模型”的方法。这意味着在模型中纳入全部感兴趣的标志物和全部标准变量,无论是否有统计学意义。该模型可以评估调整所有变量后标志物效应大小,便于不同研究间的比较。因此,应报告标准化模型,包括标志物和每个标准变量的估计值、精确度及显著性(置信区间和P值)。
【条目18】如果有进一步的其他分析结果,如预期假设的验证、敏感性分析及内部验证,应予以报告
【解读】如果模型假设(例如比例风险,协变量的共线性及缺失数据的处理机制等)都是合理的,或其结果对某种假设并不十分敏感,那么预后分析的结果具有较大可信度。此外,如果采用了敏感性分析,或进行了内部及外部验证,其结果也应如实报告。作者应避免过多的亚组分析,尤其是计划外的亚组分析。如果做了相关的分析以检验假设或者证明结果的稳定性,应予以简要陈述。
四、讨论
【条目19】结合预先假设及其他相关研究对结果做出解释,包括对研究局限性的讨论
【解读】在早期发表的论文中,许多文章习惯于阐述研究结果的价值并提供各种支持,但较少对研究的不足进行论证。在讨论部分,可以先简单重述研究目的以及研究假设,然后对研究的主要发现进行概述,客观地评价报告的结果。讨论当前研究的局限性,包括数据存在的偏倚及不一致,检测方法的局限性,研究设计或数据分析方法的局限性等。作者应评估研究结果是否能推广到该研究未涉及的其他人群,并与其他已发表研究的相关结果进行比较,若不一致则尽可能做出适当的解释。
【条目20】讨论本研究对未来研究的意义及临床价值
【解读】研究的最终目的是提供一个有临床价值的工具以改善患者的预后。因此,在讨论部分需要明确该研究在多大程度上实现了这个目标,并探讨下一步应该采取的行动。进行研究标志物最根本的原因就是为了获得疾病生物学的相关信息,寻找支持临床决策的新方法,或者开发新的治疗方式。如果研究结果显示肿瘤标志物与临床结局之间存在关联,那么这些关联可能对临床诊断和治疗有重要价值;若标志物不能提供更多的预后信息,但更容易评估、更便宜或更可重复,那么在临床上也有重要意义。
注:本文内容是参考相关文献后对REMARK声明原文的解读,仅代表本网站观点。关于REMARK声明的更多内容详见网站(https://cdp.cancer.gov/)或(https://www.equator-network.org/reporting-guidelines/reporting-recommendations-for-tumour-marker-prognostic-studies-remark/),或阅读Douglas G Altman等发表的论文“Reporting Recommendations for Tumor Marker Prognostic Studies (REMARK): explanation and elaboration (https://pubmed.ncbi.nlm.nih.gov/22675273/)”