关键词:诊断试验; 设计类型; 单组设计; 平行组设计; 配对设计
根据不同的研究目的,诊断试验研究设计常分为单组设计、平行组设计和配对设计。
一、单组设计
(一) 研究设计概述
单组设计常用于评价一种新试验的诊断效能,此种研究设计和金标准比较,不专门设立对照组。
(二) 应用场景举例
临床确诊肺癌的金标准为组织穿刺活检,但该方法为有创检查,对患者会造成一定损伤。假设有一种新的CT扫描方法,理论上具有较好的灵敏度和特异度,现需要对其诊断效能进行评价则可采用单组设计的诊断试验研究。设计思路概述为对疑似患者运用上述CT扫描方法诊断后,与组织穿刺活检结果比较,评价该CT扫描方法的诊断效能(灵敏度、特异度、Kappa值等)。
(三) 具体案例简析
- 题目:原发性心脏肿瘤术前超声心动图诊断与术后病理诊断的一致性(图1)
- 来源:临床与实验病理学杂志, 2021, 37(9): 1065-1070.
- 目的:探讨原发性心脏肿瘤术前超声心动图诊断与术后病理诊断的一致性
- 意义:心脏肿瘤活检技术存在一定的困难和风险,临床上通常采用术前影像技术(如超声心动图)进行初步诊断,以指导临床治疗。因此,需要评估超声心动图对初步定性诊断心脏肿瘤性质的能力。
- 研究设计:作者以128例拟行原发性心脏肿瘤切除术但未明确心脏肿瘤性质的患者为研究对象,所有患者术前行超声心动图检查,将其检查结果与术后病理诊断结果比较,计算超声心动图判断肿瘤性质的灵敏度、误诊率及Kappa值。研究发现,超声心动图诊断心脏原发性肿瘤的良、恶性与金标准病理诊断具有极好的一致性。
二、平行组设计
(一) 研究设计概述
平行组设计常用于比较两种或多种新试验的诊断效能是否有差异,各试验组分别检测不同的样本人群,所有结果均与金标准结果进行比较,分析各试验的诊断试验评价指标,并比较不同方法间诊断效能是否有差异。此种设计本质是多个单组设计诊断试验研究的组合,它不仅可以评价各新方法的诊断效能,还能同时比较两种或多种新方法的诊断效能是否有差异。
注意使用平行组设计时,不同的新诊断试验检测的样本人群不同。因此,该种设计须先确保不同组别之间均衡可比,即年龄、性别或其他可能影响诊断结果的重要因素组间比较,差异无统计学意义。
(二) 应用场景举例
比较A、B两种CT扫描方法诊断肺癌的价值是否有差异。先用A方法诊断30例疑似肺癌患者,再用B方法诊断另外30例疑似肺癌患者,最后对上述60例患者均进行组织穿刺活检(金标准)。分别计算A、B两种方法检测的诊断效能评价指标(如灵敏度、特异度、约登指数等);然后再对A、B两种方法的灵敏度、特异度等指标进行独立样本比较,以评估A、B两种方法诊断效能是否存在统计学差异。
(三) 具体案例简析
- 题目:Endoscopic Ultrasound-guided Fine-needle Biopsy With or Without Rapid On-site Evaluation for Diagnosis of Solid Pancreatic Lesions: A Randomized Controlled Non-Inferiority Trial [使用或不使用快速现场评估技术(ROSE)的超声引导下的细针活检(EUS-FNB)诊断胰腺实体病变(SPLs):一项随机对照非劣效性试验(图2)]
- 来源:Gastroenterology, 2021, 161(3): 899-909, e5.
- 目的:验证在胰腺实体病变(SPLs)中,无快速现场评估技术(ROSE)超声引导下的细针活检(EUS-FNB)的诊断准确性不低于有ROSE的EUS-FNB
- 意义:使用新一代FNB针时,快速现场评估(ROSE)对内镜超声引导细针活检(EUS-FNB)诊断准确性的益处从未在一项随机研究中进行评估。
- 研究设计:这项非劣效性研究在8个国家的14个中心进行,非劣效性界值为5%。将研究对象按1:1随机分配至ROSE和无ROSE的EUS-FNB组,然后均使用金标准确诊SPLs,分别计算两组的诊断准确性,并对两组准确性进行比较。在18个月的研究时间里,800例患者被随机分配,其中771例纳入分析(ROSE组385例,无ROSE组386例)。两组患者的诊断准确率差异无统计学意义(ROSE组为96.4%,无ROSE组为97.4%,P=0.396)。无ROSE的EUS-FNB非劣效性得到证实,其绝对风险差异为1.0%(双侧90% CI为-1.1%至3.1%,P非劣效性<0.001)。研究证实当使用新一代FNB针时,ROSE不应被推荐为常规方法。
三、配对设计
(一) 研究设计概述
配对设计应用范围与平行组设计相同,区别在于配对设计中两种或多种试验检测的是同一研究对象,可避免了平行组设计中组间因素分布不均衡导致的偏倚,这样既减小了样本量,又提高了研究准确性。但配对设计需要研究对象接受两种或多种试验的检测,在实际临床诊疗过程中有时难以实现。
配对设计根据有无金标准又分为有金标准的配对设计和无金标准的配对设计。有金标准的配对设计除了可比较待评价试验之间各种指标(如灵敏度、特异度)的差异,还可开展联合诊断分析,进行串联、并联试验的探索。值得注意的是,无金标准的配对设计中,没有用金标准对研究对象进行平行诊断,一般无法准确获得各种检测方法的灵敏度、特异度等评价指标。因此,不能评价不同试验间孰优孰略,一般仅评价不同试验间一致性的程度。
(二) 应用场景举例
1. 有金标准的配对设计
比较A、B两种CT扫描方法对诊断肺癌的价值是否有差异。用A、B两种方法和组织穿刺活检(金标准)分别诊断相同的30例肺癌高危人群,分别计算A、B两种方法的诊断效能(如灵敏度、特异度、ROC曲线的曲线下面积等);然后对A、B两种方法间的灵敏度、特异度等指标进行配对样本比较,以检验其各个指标是否存在统计学差异。
2. 无金标准的配对设计
在医学研究中经常存在无金标准(例如精神心理相关疾病诊断评价),或虽然有金标准但难以实施(如冠状动脉造影、肿瘤穿刺活检等具有创伤性、侵入性的试验)的情况。针对上述情况需采用无金标准的配对设计,以评价检测结果的一致性。无金标准的配对设计最常应用于体外诊断试剂评价或检测方法评价。
如利用待评价试剂和参比试剂同时检测1000份样品,计算其阳性符合率、阴性符合率、总符合率及其95%CI。但也有一些特殊的统计学分析方法(如潜在类别/剖面分析、Bayesian评价方法等)可用于无金标准或金标准诊断不完善情况下评价诊断试验的准确性。
(三) 具体案例简析
1. 有金标准的配对设计
- 题目:超声心动图检查在心脏良恶性肿瘤鉴别诊断中的应用价值(图3)
- 来源:临床医学研究与实践, 2022, 7(1): 130-133.
- 目的:探讨超声心动图检查在心脏良恶性肿瘤鉴别诊断中的应用价值
- 意义:手术病理是临床上诊断心脏肿瘤良恶性的金标准,但该方法需要在手术切除肿瘤后进行,不能在术前为手术方案的制定提供可靠依据,因此有必要寻找鉴别心脏肿瘤性质的术前诊断方法。计算机断层扫描(computed tomography,CT)、磁共振成像(magnetic resonance imaging,MRI)和超声心动图检查均属于无创术前检查方法,因此有必要探讨这些方法对心脏肿瘤良恶性鉴别的价值。
- 研究设计:作者以85例初筛诊断为心脏肿瘤尚未明确肿瘤性质的患者为研究对象。所有患者均实施CT、MRI、超声心动图3种检查,并以术后病理诊断结果为金标准。分别计算3种方法的灵敏度、特异度、准确度、阳性预测值和阴性预测值,并比较了不同方法之间各个评价指标的差异。研究发现超声心动图的灵敏度、特异度、准确度、阳性预测值和阴性预测值均高于CT和MRI。
2. 无金标准的配对设计
- 题目:新建HIV-1新发感染快速检测方法与ELISA法的比较研究(图4)
- 来源:中国艾滋病性病, 2017, 23(6): 474-477.
- 目的:初步评价艾滋病病毒Ⅰ型(HIV-1)新发感染快速检测方法在横断面现场调查人群样本中的应用能力。
- 意义:对于HIV-1新发感染的检测目前还无金标准方法。但已有两种商品化的方法可检测HIV-1新发感染,即BED捕获酶免疫法(BED法)和LAg限制性抗原亲和力方法(LAg法),只是这两种方法检测成本价高、并且操作难度较高,不易大范围推广。作者团队前期建立了一种基于限制性抗原亲和力的快速检测法,价格低廉、易于操作,并且经过实验室研究发现在检测新发感染上具有较高准确性,且与商品化试剂检测结果比对,具有很高的一致性和符合率,提示该方法具有潜在的应用价值。现需要进一步验证该方法在现场人群中的应用效果。
- 研究设计:作者选择了2014年江西省国家级哨点新报告的排除既往感染的HIV-1确诊阳性病例127例。所有病例均使用快速检测法、BED法和LAg法进行检测,分别计算3种方法的新近感染检出率,然后计算快速检测法与BED法和LAg法之间的一致率和Kappa值。研究发现,快速检测法与BED法和LAg法之间具有较好的一致性。
四、小结
在临床研究过程中,应根据不同的研究目的和实际情况选择合适的研究设计类型及相应的评价指标。不同设计类型的诊断试验研究的简要特点见表1。