医学研究之多样本定性资料样本量计算——分层设计的Cochran-Mantel-Haenszel检验

发布于 2022年3月17日 星期四 11:55:40 浏览:4344
原创不易,转载请注明来源,感谢!

前面介绍了“医学研究之多样本定性资料样本量计算——多个处理组和对照组的多重比较”,本文将介绍分层设计的两样本比例的Cochran-Mantel-Haenszel检验(Tests for Two Proportions in a Stratified Design)。在分层设计中,受试者从两个或多个层中被选择,这些层由重要的协变量组成,如性别、年龄、收入水平或婚姻状况等。各层中两组各受试者人数按设计设定。每个层形成一个单独的2×2表。尽管各层的响应率可能有所不同,但关于总体优势比的假设可以通过Cochranm-Mantel-Haenszel检验(简称CMH检验)来进行。CMH检验包括连续校正和非连续性校正,前者更为常用。

一、案例数据

在一项关于饮酒和与食道癌关系的病例对照研究中,经过粗分析得到OR=3.5,由于吸烟与食道癌存在关联,因此需要将吸烟作为混杂因素进行分层分析。现将人群分为吸烟组和不吸烟组,其构成比分别为60%和40%,每个组中随机抽取相同数量的病例和对照。以往研究表明,2个组中对照人群的饮酒率分别为0.42和0.58,取α =0.05,β=0.1,试估计所需的样本含量。

二、案例分析

本例中以混杂因素吸烟进行分层分析,开展饮酒和与食道癌关系的病例对照研究,可使用CMH检验,需要以下几个参数:

1. 协变量每层样本含量的构成比,本例为0.6和0.4。

2. 对照组每层响应比例,本例中为0.42与0.58。

3. 设定H0下的优势比OR0,在标准CHM检验中,假设OR0=1,本例为1。

4. 设定H1下两个比例的优势比OR1,本例为3.5。

3. 检验水准α (通常取0.01至0.1,本研究取0.05)。

4. 每组检验功效1-β (通常为0.8或更高,本研究取0.9)。

5. 脱失率DR (通常不宜超过20%,本研究取10%)。

三、软件操作

(一) 方法选择

在左侧界面中依次选择“Procedures (程序)”—“Proportions (比例)” —“Stratified (分层设计)”—“Tests for Two Proportions in a Stratified Design(Cochran/Mantel-Haenszel Test) (分层设计的两样本比例的Cochran-Mantel-Haenszel检验)”,见图1。

图1

(二) 参数设置

在“Design 1 (设置)”模块中按以下参数设置相应选项(图2):

①Solve For:选择“Sample Size”,表示本分析的目的是用于计算样本量。

②H1(Alternative Hypothesis):选择“Two-Sided(H1:OR1≠OR0)”,表示进行双侧检验。

③Continuity Correction:指定是否使用连续性校正,本例中勾选,以使检验水准和检验功效更准确。

④Power and Alpha:Power为把握度,填写“0.90”;Alpha为检验水准,填写“0.05”。

⑤M(Sample Size Multiplier):设定样本量乘数M,采用公式N1 = M×R1、N2 = M×R2计算各层内的群体样本量,本例中该选项被隐藏。

若M为每组的样本量,R1和R2须都为1;若M为每层的样本量,则每层中R1和R2之和都必须为1;若M为所有层的总样本量,则所有层的R1和R2的总和必须为1。本例中M为所有层的总样本量,因此R1和R2取构成比的1/2。

⑥OR0(Odds Ratio|H0):设定备择假设H0下的优势比OR0。对于每一层,该值与Pr(Success)值一起计算在H0下的第一组(处理组)中获得成功的概率。在标准Cochran-Mantel-Haenszel检验中,假定该值为1,本例中填写“1”。

⑦OR1(Odds Ratio|H1):设定H1下两个比例的优势比OR1,本例中填“3.5”。

⑧Strata Information(Continued on Design 2 tab):【Strata】列表示指定所在行的层数;【R1=N1/M】和【R2=N2/M】分别用于获得每层中第1组(处理组)和第2组(对照组)的样本量,公式为N1 = M×R1、N2 = M×R2,且R1和R2须为正数。此处R1与R2之和为吸烟组的构成比0.6,且R1=R2,所以R1填0.3,R2填R1(或0.3);【Pr(Success)】表示成功响应的基线概率,该值与OR1一起用于计算组1(吸烟族)暴露的概率,本例中为0.42。详细参数见图2。

图2

在“Design 2 (设置)”模块中按以下参数设置层数2中的相应选项(图3):

图3

(三) 脱失率设置

在“Reports (结果报告)”模块中,勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”,在“Dropout Rate”中填写“10%”(图4),表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。

图4

四、结果及解释

图5列出了该研究设计的相关参数和样本量计算结果,可知各组样本例数(N)为135.43*(0.6+0.4)*0.5=67.715≈68,因此总样本量为68*2=136。吸烟层各组样本量为135.43*0.6*0.5=40.629≈41,不吸烟层各组样本量为135.43*0.4*0.5=27.086≈27。

图5

图6“References (参考文献)”列出了该计算过程中参考的相关文献;“Report Definitions (报告定义)”列出了各个参数的具体解释;“Summary Statements (报告概述)”为整个分析报告的摘要。

图6

图7“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N'),也是研究实际开展过程中需要达到的最低样本量,本研究中各组样本例数(N)为76,总样本量为76*2=152。吸烟层各组样本量为152*0.6*0.5=45.6≈46,不吸烟层各组样本量为152*0.4*0.5= 30.4≈30。

图7

图8为此次样本量估算整个过程的详细参数设置汇总。

图8

五、结论

该案例研究饮酒与食道癌的关系,以吸烟为协变量进行分层分析。所有人群按吸烟与否被分为两个组,构成比分别为0.6(吸烟组)与0.4(非吸烟组),吸烟组R1=0.3,非吸烟组R2=0.2。两组中对照人群的饮酒率分别为0.42和0.58 。已知OR0=1、OR1=3.5,若取检验水准0.05,检验功效为0.90,则吸烟层各组样本量为41,不吸烟层各组样本量为27,每组样本量为68,总样本量为136例。若考虑10%的脱失率,则吸烟层各组样本量为46,不吸烟层各组样本量为30,每组样本量为76,总样本量为152例。

End
文章目录 沉浸式阅读