一、案例数据
某公司欲探究不同职业(分为A、B、C三个职业类别)与医疗保险立法态度是否存在关系,针对医疗保险立法态度,研究对象可持有三种选择,即同意、中立、不同意,假设小效应(w = 0.1)、中效应(w = 0.3)、大效应(w = 0.5),取α=0.05,β =0.1,试估计不同效应时至少需要多少研究对象?
二、案例分析
本例中,计算列联表中多个比例的差异性检验的样本量可采用卡方检验,需要以下几个参数:
1. 指定卡方分布的的自由度DF,本例为(3-1)*(3-1)=4。
2. 效应值大小w,本例为0.1、0.3、0.5。
3. 检验水准α (通常取0.01至0.1,本例为0.05)。
4. 检验功效1-β (通常为0.8或更高,本研究取0.9)。
5. 脱失率DR (通常不宜超过20%,本例取10%)。
三、软件操作
(一) 方法选择
在左侧界面中依次选择“Procedures (程序)”—“Propotions (比例值)”—“Contingency Table (Chi-Square Tests) (列联表卡方检验)”,见图1。
(二) 参数设置
在“Design (设置)”模块中按以下参数设置相应选项(图2):
①Solve For:选择“Sample Size”,表示本分析的目的是用于计算样本量。
②DF(Degrees of Freedom):表示卡方分布的自由度,对于列联表的独立性检验,自由度为(R-1)(C-1),其中R为行数,C为列数。本例DF=(3-1)*(3-1)=4。
③Power and Alpha:Power为把握度,填写“0.90”;Alpha为检验水准,填写“0.05”。
④W(Effect Size):即效应值大小W=\(\sqrt{\frac{\chi^{2}}{\mathrm{~N}}}\),本例中包含三种效应:小效应(w = 0.1)、中效应(w = 0.3)、大效应(w = 0.5)。
(三) 脱失率设置
在“Reports (结果报告)”模块中,勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”,在“Dropout Rate”中填写“10%”(图3),表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。
四、结果及解释
图4列出了该研究设计的相关参数和样本量计算结果,可知小、中、大效应对应的样本例数(N)分别为62、172和1541。
图5“References (参考文献)”列出了该计算过程中参考的相关文献;“Report Definitions (报告定义)”列出了各个参数的具体解释;“Summary Statements (报告概述)”为整个分析报告的摘要。
图6“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N'),也是研究实际开展过程中需要达到的最低样本量,本研究中小、中、大效应分别对应为69、192和1713。
图7展现了样本量随效应值大小的变化而变化。
图8为此次样本量估算整个过程的详细参数设置汇总。
五、结论
该案例利用列联表独立性的卡方检验计算样本量,从而检验两个分类变量间是否存在关联。已知本研究中为3*3列联表,卡方分布自由度为4,若取检验水准0.05、检验功效0.90,则至少分别62、172和1541例研究对象才能发现小、中、大效应。若考虑10%的脱失率,则至少分别69、192和1713例研究对象。