医学研究之多样本定性资料样本量计算——分层设计的Cochran-Mantel-Haenszel检验

2022年3月17日星期四发布于 11:55:40 浏览：5296

原创不易，转载请注明来源，感谢！

前面介绍了“医学研究之多样本定性资料样本量计算——多个处理组和对照组的多重比较”，本文将介绍分层设计的两样本比例的Cochran-Mantel-Haenszel检验(Tests for Two Proportions in a Stratified Design)。在分层设计中，受试者从两个或多个层中被选择，这些层由重要的协变量组成，如性别、年龄、收入水平或婚姻状况等。各层中两组各受试者人数按设计设定。每个层形成一个单独的2×2表。尽管各层的响应率可能有所不同，但关于总体优势比的假设可以通过Cochranm-Mantel-Haenszel检验(简称CMH检验)来进行。CMH检验包括连续校正和非连续性校正，前者更为常用。

一、案例数据

在一项关于饮酒和与食道癌关系的病例对照研究中，经过粗分析得到OR=3.5，由于吸烟与食道癌存在关联，因此需要将吸烟作为混杂因素进行分层分析。现将人群分为吸烟组和不吸烟组，其构成比分别为60%和40%，每个组中随机抽取相同数量的病例和对照。以往研究表明，2个组中对照人群的饮酒率分别为0.42和0.58，取α =0.05，β=0.1，试估计所需的样本含量。

二、案例分析

本例中以混杂因素吸烟进行分层分析，开展饮酒和与食道癌关系的病例对照研究，可使用CMH检验，需要以下几个参数：

1. 协变量每层样本含量的构成比，本例为0.6和0.4。

2. 对照组每层响应比例，本例中为0.42与0.58。

3. 设定H_₀下的优势比OR_₀，在标准CHM检验中，假设OR_₀=1，本例为1。

4. 设定H_₁下两个比例的优势比OR_₁，本例为3.5。

3. 检验水准α (通常取0.01至0.1，本研究取0.05)。

4. 每组检验功效1-β (通常为0.8或更高，本研究取0.9)。

5. 脱失率DR (通常不宜超过20%，本研究取10%)。

三、软件操作

(一) 方法选择

在左侧界面中依次选择“Procedures (程序)”—“Proportions (比例)” —“Stratified (分层设计)”—“Tests for Two Proportions in a Stratified Design(Cochran/Mantel-Haenszel Test) (分层设计的两样本比例的Cochran-Mantel-Haenszel检验)”，见图1。

(二) 参数设置

在“Design 1 (设置)”模块中按以下参数设置相应选项(图2)：

①Solve For：选择“Sample Size”，表示本分析的目的是用于计算样本量。

②H₁(Alternative Hypothesis)：选择“Two-Sided(H₁：OR₁≠OR₀)”，表示进行双侧检验。

③Continuity Correction：指定是否使用连续性校正，本例中勾选,以使检验水准和检验功效更准确。

④Power and Alpha：Power为把握度，填写“0.90”；Alpha为检验水准，填写“0.05”。

⑤M(Sample Size Multiplier)：设定样本量乘数M，采用公式N₁ = M×R₁、N₂ = M×R₂计算各层内的群体样本量，本例中该选项被隐藏。

若M为每组的样本量，R₁和R₂须都为1；若M为每层的样本量，则每层中R₁和R₂之和都必须为1；若M为所有层的总样本量，则所有层的R₁和R₂的总和必须为1。本例中M为所有层的总样本量，因此R₁和R₂取构成比的1/2。

⑥OR₀(Odds Ratio|H₀)：设定备择假设H₀下的优势比OR₀。对于每一层，该值与Pr(Success)值一起计算在H₀下的第一组(处理组)中获得成功的概率。在标准Cochran-Mantel-Haenszel检验中，假定该值为1，本例中填写“1”。

⑦OR₁(Odds Ratio|H₁)：设定H₁下两个比例的优势比OR₁，本例中填“3.5”。

⑧Strata Information(Continued on Design 2 tab)：【Strata】列表示指定所在行的层数；【R₁=N₁/M】和【R₂=N₂/M】分别用于获得每层中第1组(处理组)和第2组(对照组)的样本量，公式为N₁ = M×R₁、N₂ = M×R₂，且R₁和R₂须为正数。此处R₁与R₂之和为吸烟组的构成比0.6，且R₁=R₂，所以R₁填0.3，R₂填R₁(或0.3)；【Pr(Success)】表示成功响应的基线概率，该值与OR₁一起用于计算组1(吸烟族)暴露的概率，本例中为0.42。详细参数见图2。

在“Design 2 (设置)”模块中按以下参数设置层数2中的相应选项(图3)：

(三) 脱失率设置

在“Reports (结果报告)”模块中，勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”，在“Dropout Rate”中填写“10%”(图4)，表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。

四、结果及解释

图5列出了该研究设计的相关参数和样本量计算结果，可知各组样本例数(N)为135.43*(0.6+0.4)*0.5=67.715≈68，因此总样本量为68*2=136。吸烟层各组样本量为135.43*0.6*0.5=40.629≈41，不吸烟层各组样本量为135.43*0.4*0.5=27.086≈27。

图6“References (参考文献)”列出了该计算过程中参考的相关文献；“Report Definitions (报告定义)”列出了各个参数的具体解释；“Summary Statements (报告概述)”为整个分析报告的摘要。

图7“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N')，也是研究实际开展过程中需要达到的最低样本量，本研究中各组样本例数(N)为76，总样本量为76*2=152。吸烟层各组样本量为152*0.6*0.5=45.6≈46，不吸烟层各组样本量为152*0.4*0.5= 30.4≈30。

图8为此次样本量估算整个过程的详细参数设置汇总。

五、结论

该案例研究饮酒与食道癌的关系，以吸烟为协变量进行分层分析。所有人群按吸烟与否被分为两个组，构成比分别为0.6(吸烟组)与0.4(非吸烟组)，吸烟组R₁=0.3，非吸烟组R₂=0.2。两组中对照人群的饮酒率分别为0.42和0.58 。已知OR_₀=1、OR_₁=3.5，若取检验水准0.05，检验功效为0.90，则吸烟层各组样本量为41，不吸烟层各组样本量为27，每组样本量为68，总样本量为136例。若考虑10%的脱失率，则吸烟层各组样本量为46，不吸烟层各组样本量为30，每组样本量为76，总样本量为152例。

我要纠错

End

医学研究之多样本定性资料样本量计算——多个处理组和对照组的多重比较

医学研究之多样本定性资料样本量计算——比例趋势的Cochran-Armitage检验