关键词:加强流行病学中观察性研究报告质量; STROBE; 观察性研究报告规范; 队列研究报告规范
(九) 统计方法
【条目12a】描述所有统计方法,包括控制混杂的方法
【解读】研究者应在研究方案中预先确定针对主要研究目标的分析方法。总的来说,并没有哪种统计分析方法绝对正确。可能有好几种方法能回答同一个问题,但是它们的假设是不同的。有时受数据驱使,还需调整分析方法或补充分析。在研究报告中,研究者需要告诉读者分析方法是否受到数据驱使和开展每种分析的原因。如果被比较的各组之间在某些重要特征(潜在混杂因素)上有差异,则需要通过分层或多变量回归的方法对其进行调整。一般来说,研究设计决定了选择何种回归分析。例如,队列研究常用Cox比例风险回归,而病例对照研究多使用Logistic回归。研究者除了应报告最终模型中纳入了哪些变量,还应详细描述是如何选择这些变量的。其他统计分析(如数据填补、数据转换、归因危险度的计算等)也应在报告中进行描述。使用非标准方法或新方法时,应标注参考文献并报告所使用的统计软件。在报告统计学方法时,一个指导性原则是,要详细描述统计方法,以便让掌握相关知识和具有原始数据访问权的读者验证报告的结果。
【条目12b】描述亚组分析和交互作用分析的方法
【解读】许多研究都开展了亚组分析。研究者需要报告哪些亚组分析是预先确定的,哪些是分析数据过程中决定开展的。研究者还需要解释交互作用是如何检验的。交互作用包括相加交互作用和相乘交互作用,其中相加交互作用更适用于公共卫生和临床决策。研究者还可以报告各暴露的独立效应和联合效应以提供更加丰富的信息。
【条目12c】描述缺失数据如何处理
【解读】缺失数据在观察性研究中很常见。研究者可使用统计学方法来处理缺失值。研究者应报告各变量(暴露、结局和混杂因素)和各步骤中的缺失值的数量,尽可能报告数据缺失的原因,并描述有多少研究对象因为数据缺失而被排除。研究者还应描述处理缺失值的方法(如多重插补)和所采用的假设(如缺失是随机的)。
【条目12d】如可能,描述如何处理失访
【解读】研究对象在随访截止之前退出研究的情况称为失访。如果失访选择性出现在暴露人群中,研究的有效性会受到影响。研究者需要在研究设计阶段就确定如何处理失访,报告有多少研究对象失访,以及采用了何种策略处理失访。
【条目12e】描述敏感性分析的方法
【解读】敏感性分析可用于判断采用替代分析方法或在其他假定的情况下,研究的主要结果是否一致。敏感性分析可以检验的问题包括:纳入标准、暴露或结局的定义、调整的混杂因素、缺失值的处理、潜在的选择偏倚,对于变量(暴露、结局或混杂因素)不准确或不一致的测量导致的偏倚等,研究者应对敏感性分析的目的和方法进行报告。
四、结果
(一) 研究对象
【条目13a】报告各阶段研究对象数量,如可能合格的人数、参加合格性检查的人数、被证实合格的人数、纳入研究的人数、完成随访的人数和纳入分析的人数
【解读】有关研究对象募集过程的详细信息很重要。纳入研究的个体通常与目标人群在某些方面不一致,因此研究得出的暴露与疾病之间的关联未必能够真实反映目标人群中的关联。对研究对象参与和拒绝参与的原因进行报告是至关重要的。同时,读者需要了解研究者如何计算参与率、响应率和随访率。研究者应报告从选择目标人群到纳入研究对象再到进行数据分析各阶段入选的研究对象数量。根据研究类型的不同,这些信息包括可能合格的人数、接受合格性评估的人数、合格者的人数、纳入研究的人数、接受检查的人数、随访的人数和纳入分析的人数。
【条目13b】描述各阶段退出研究的原因
【解读】报告研究对象在各个阶段退出研究或未纳入统计学分析的原因,有助于读者判断研究人群是否能够代表目标人群,以及是否产生偏倚。
【条目13c】推荐使用流程图
【解读】内容丰富、结构清晰的流程图比文字更加直观地表达信息。流程图中也可以包括主要结果(如主要结局事件的发生数量)。
(二) 描述性资料
【条目14a】描述研究对象的特征(如人口学、临床和社会特征)、关于暴露和潜在混杂因素的信息
【解读】读者需要了解有关研究对象特征和暴露的信息,以判断结果的可推广性 (generalizability)。有关潜在混杂因素的信息(包括是否和如何测量)。研究者应采用均数和标准差对各组连续变量进行汇总(如数据呈非正态分布,则应报告中位数和四分位数间距)。类别较少的有序变量(如疾病的Ⅰ~Ⅳ级)不能被当作连续变量来处理,而是应报告各类的数量和比例。涉及组间比较的研究,应分组报告描述性特征和数量。统计推断指标(如标准误和置信区间)不能用于描述特征变量的变异性,同时应避免显著性检验结果出现在描述性表格中;P值不能用于混杂因素筛选并调整的判断标准,对研究结局作用较大的混杂因素,即使其差异无统计学意义也同样需要调整。
【条目14b】报告各变量上存在缺失数据的人数
【解读】缺失值可能导致偏倚或影响结果的可推广性。研究者需报告暴露、潜在混杂因素和其他重要特征缺失值的情况。在队列研究中,研究者应报告失访人数和原因,可使用表格和图列出缺失值的数量。
【条目14c】总结随访时间(如总随访时间和平均随访时间)
【解读】研究者应提供平均随访时间(均数或中位数)以便读者了解随访的持续时间和频率或通过均数计算随访总人时数;研究者也可提供最短和最长随访时间或随访时间分布的四分位间距,以便读者了解随访时间的分布情况。
(三) 结局资料
【条目15】报告结局事件数量或人时综合指标
【解读】在报告暴露与结局的关联之前,研究者需报告描述性资料。队列研究中应按照不同暴露分组报告各结局事件的数量和每随访人年结局事件的发生率。如果事件的发生率随时间而改变,则可按照合适的随访间隔报告事件的发生数和发生率,或使用Kaplan-Meier法描述。
1. 主要结果
【条目16a】如可能,报告未调整及调整混杂因子后的效应估计值及精确度(如95%置信区间)。阐明对哪些混杂因素进行了调整,以及选择这些混杂因素的原因
【解读1】大多数情况下,研究者会同时报告调整混杂因子前、后的分析结果。在报告调整混杂因子前的结果时,研究者应同时提供主要数据(如暴露组和对照组结局事件发生的数量),以便读者了解关联指标计算的相关数据;而对于调整后的结果,研究者还应报告分析中研究对象的数量。读者通过比较调整前后的结果,判断混杂的大小和方向。值得注意的是,研究结果的真实性通常取决于研究者对重要混杂因素的了解程度、各变量测量的准确度以及统计学模型构建的合理性,研究者应对所有潜在混杂因素进行解释,并说明其在统计模型中纳入或排除变量的标准,同时谨慎解读调整后的分析结果。
【条目16b】对连续变量进行分组时,报告分组界值
【解读】连续变量的分组对数据分析和结果有重要影响。报告分组界值的划分方式有助于比较不同研究之间的结果和开展Meta分析。除了报告各类别分界值,研究者还应报告各类别的数据范围和均数/中位数、各暴露组的结局数据(如人数或人时数)。
【条目16c】如果有关联,可将有意义的危险因素的相对危险度转换为针对有意义的时间范围内的绝对危险度
【解读】暴露与疾病的关联通常用相对指标表示。与绝对指标相比,相对指标在不同研究和人群之间有更好的一致性;但在许多情况下,暴露的绝对危险更受关注。归因危险度、人群归因危险度等指标能够反映消除暴露后能够降低多少疾病发生的概率。研究者应详细报告计算归因危险度的公式及具体方法。
2. 其他分析
【条目17】报告其他分析,如亚组分析、交互作用分析和敏感性分析
【解读】除了主要分析以外,观察性研究中往往还会进行其他分析,如亚组分析、交互作用分析和敏感性分析。报告亚组分析时,研究者应说明哪些是预先确定的,哪些是受数据驱使的。报告交互作用分析时,建议研究者以表格的形式报告各暴露的单独效应和联合效应,以便读者评价相加交互作用或相乘交互作用,不能通过比较各亚组P值来判断交互作用,也不能因为置信区间重叠就判断不存在交互作用。敏感性分析有助于判断统计分析中变量选择、缺失值或偏倚对结果的影响。报告敏感性分析时,研究者应对重要的敏感性分析结果进行详细报告,例如敏感性分析结果与主要分析结果相差较大的情况;而与主要分析结果一致的结果无需逐一报告。
注:本文内容是参考相关文献后对STROBE报告规范原文的解读,仅代表本网站观点。关于队列研究STROBE声明的更多内容详见STROBE官方网站(http://www.strobe-statement.org/)或Erik von Elm等发表的论文“The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE) statement: guidelines for reporting observational studies (https://pubmed.ncbi.nlm.nih.gov/25046131/)”、Jan P. Vandenbroucke 等发表的论文“Strengthening the Reporting of Observational Studies in Epidemiology (STROBE): explanation and elaboration (https://pubmed.ncbi.nlm.nih.gov/17941715/)”和詹思延发表的论文“如何报告观察性流行病学研究——国际报告规范STROBE解读(http://www.cjebp.net/CN/volumn/volumn_1.shtml)”。