医学研究之多样本定性资料样本量计算——列联表的卡方检验

发布于 2022年3月17日 星期四 11:46:14 浏览:5542
原创不易,转载请注明来源,感谢!

多样本比例的统计方法主要用于定性资料多样本研究设计,目的是检验多个比例之间差异是否具有统计学意义。列联表的卡方检验是最常用的卡方检验,用于确定两个多分类变量间是否存在关联,常用于各种调查研究,本文将介绍列联表的卡方检验样本量计算过程及注意事项。

一、案例数据

某公司欲探究不同职业(分为A、B、C三个职业类别)与医疗保险立法态度是否存在关系,针对医疗保险立法态度,研究对象可持有三种选择,即同意、中立、不同意,假设小效应(w = 0.1)、中效应(w = 0.3)、大效应(w = 0.5),取α=0.05,β =0.1,试估计不同效应时至少需要多少研究对象? 

二、案例分析

本例中,计算列联表中多个比例的差异性检验的样本量可采用卡方检验,需要以下几个参数:

1. 指定卡方分布的的自由度DF,本例为(3-1)*(3-1)=4。

2. 效应值大小w,本例为0.1、0.3、0.5。

3. 检验水准α (通常取0.01至0.1,本例为0.05)。

4. 检验功效1-β (通常为0.8或更高,本研究取0.9)。

5. 脱失率DR (通常不宜超过20%,本例取10%)。

三、软件操作

(一) 方法选择

在左侧界面中依次选择“Procedures (程序)”—“Propotions (比例值)”—“Contingency Table (Chi-Square Tests) (列联表卡方检验)”,见图1。

图1

(二) 参数设置

在“Design (设置)”模块中按以下参数设置相应选项(图2):

①Solve For:选择“Sample Size”,表示本分析的目的是用于计算样本量。

②DF(Degrees of Freedom):表示卡方分布的自由度,对于列联表的独立性检验,自由度为(R-1)(C-1),其中R为行数,C为列数。本例DF=(3-1)*(3-1)=4。

③Power and Alpha:Power为把握度,填写“0.90”;Alpha为检验水准,填写“0.05”。

④W(Effect Size):即效应值大小W=\(\sqrt{\frac{\chi^{2}}{\mathrm{~N}}}\),本例中包含三种效应:小效应(w = 0.1)、中效应(w = 0.3)、大效应(w = 0.5)。

图2

(三) 脱失率设置

在“Reports (结果报告)”模块中,勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”,在“Dropout Rate”中填写“10%”(图3),表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。

图3

四、结果及解释

图4列出了该研究设计的相关参数和样本量计算结果,可知小、中、大效应对应的样本例数(N)分别为62、172和1541。

图4

图5“References (参考文献)”列出了该计算过程中参考的相关文献;“Report Definitions (报告定义)”列出了各个参数的具体解释;“Summary Statements (报告概述)”为整个分析报告的摘要。

图5

图6“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N'),也是研究实际开展过程中需要达到的最低样本量,本研究中小、中、大效应分别对应为69、192和1713。

图6

图7展现了样本量随效应值大小的变化而变化。

图7

图8为此次样本量估算整个过程的详细参数设置汇总。

图8

五、结论

该案例利用列联表独立性的卡方检验计算样本量,从而检验两个分类变量间是否存在关联。已知本研究中为3*3列联表,卡方分布自由度为4,若取检验水准0.05、检验功效0.90,则至少分别62、172和1541例研究对象才能发现小、中、大效应。若考虑10%的脱失率,则至少分别69、192和1713例研究对象。

End
文章目录 沉浸式阅读