医学研究之多样本定性资料样本量计算——列联表的卡方检验

2022年3月17日星期四发布于 11:46:14 浏览：7916

原创不易，转载请注明来源，感谢！

多样本比例的统计方法主要用于定性资料多样本研究设计，目的是检验多个比例之间差异是否具有统计学意义。列联表的卡方检验是最常用的卡方检验，用于确定两个多分类变量间是否存在关联，常用于各种调查研究，本文将介绍列联表的卡方检验样本量计算过程及注意事项。

一、案例数据

某公司欲探究不同职业(分为A、B、C三个职业类别)与医疗保险立法态度是否存在关系，针对医疗保险立法态度，研究对象可持有三种选择，即同意、中立、不同意，假设小效应(w = 0.1)、中效应(w = 0.3)、大效应(w = 0.5)，取α=0.05，β =0.1，试估计不同效应时至少需要多少研究对象?

二、案例分析

本例中，计算列联表中多个比例的差异性检验的样本量可采用卡方检验，需要以下几个参数：

1. 指定卡方分布的的自由度DF，本例为(3-1)*(3-1)=4。

2. 效应值大小w，本例为0.1、0.3、0.5。

3. 检验水准α (通常取0.01至0.1，本例为0.05)。

4. 检验功效1-β (通常为0.8或更高，本研究取0.9)。

5. 脱失率DR (通常不宜超过20%，本例取10%)。

三、软件操作

(一) 方法选择

在左侧界面中依次选择“Procedures (程序)”—“Propotions (比例值)”—“Contingency Table (Chi-Square Tests) (列联表卡方检验)”，见图1。

(二) 参数设置

在“Design (设置)”模块中按以下参数设置相应选项(图2)：

①Solve For：选择“Sample Size”，表示本分析的目的是用于计算样本量。

②DF(Degrees of Freedom)：表示卡方分布的自由度，对于列联表的独立性检验，自由度为(R-1)(C-1)，其中R为行数，C为列数。本例DF=(3-1)*(3-1)=4。

③Power and Alpha：Power为把握度，填写“0.90”；Alpha为检验水准，填写“0.05”。

④W(Effect Size)：即效应值大小W=\(\sqrt{\frac{\chi^{2}}{\mathrm{~N}}}\)，本例中包含三种效应：小效应(w = 0.1)、中效应(w = 0.3)、大效应(w = 0.5)。

(三) 脱失率设置

在“Reports (结果报告)”模块中，勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”，在“Dropout Rate”中填写“10%”(图3)，表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。

四、结果及解释

图4列出了该研究设计的相关参数和样本量计算结果，可知小、中、大效应对应的样本例数(N)分别为62、172和1541。

图5“References (参考文献)”列出了该计算过程中参考的相关文献；“Report Definitions (报告定义)”列出了各个参数的具体解释；“Summary Statements (报告概述)”为整个分析报告的摘要。

图6“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N')，也是研究实际开展过程中需要达到的最低样本量，本研究中小、中、大效应分别对应为69、192和1713。

图7展现了样本量随效应值大小的变化而变化。

图8为此次样本量估算整个过程的详细参数设置汇总。

五、结论

该案例利用列联表独立性的卡方检验计算样本量，从而检验两个分类变量间是否存在关联。已知本研究中为3*3列联表，卡方分布自由度为4，若取检验水准0.05、检验功效0.90，则至少分别62、172和1541例研究对象才能发现小、中、大效应。若考虑10%的脱失率，则至少分别69、192和1713例研究对象。

我要纠错

End

医学研究之多样本定性资料样本量计算——多个处理组和对照组的多重比较