一、案例数据
某大学营养与食品卫生研究所欲研究某受试物培养基对果蝇寿命的影响,拟采用完全随机设计的方差分析。分别以浓度0%、0.022%、0.067%某受试物培养基培养,观察果蝇存活时间。通过预实验得知三组果蝇平均生存天数为65天、66天、66.8天,组内误差均方为70.89。若各组样本含量相等,取α=0.05、β=0.10,试估计所需的样本含量?
二、案例分析
0%、0.022%和0.067%某受试物培养基培养为三组不同组别,结局变量为果蝇平均生存天数,据经验可知其满足正态和方差齐性,欲研究不同浓度受试物的培养基对果蝇寿命的影响,宜采用单因素方差分析F检验。单因素方差分析F检验估算样本含量,需要以下几个参数:
1. 指定假设平均值的标准差σm, 表示F检验中所检验的平均值的变异程度。
2. 组内标准差σ,表示相同处理中对象与对象间的变异,方差分析中假设所有分组的σ 相等。
3. 检验水准α (通常取0.01至0.1,本例取0.05)。
4. 检验功效1-β (通常为0.80或更高,本研究取0.90)。
5. 脱失率DR (通常不宜超过20%,本例取10%)。
三、软件操作
(一) 方法选择
在左侧界面中依次选择“Procedures (程序)”—“Means (平均值)” —“One-Way Designs (ANOVA) (单因素方差分析设计)”—“ANOVA F-Test”(方差分析F检验)—“One-Way Analysis of Variance F-Tests (单因素方差分析F检验)”,见图1。
(二) 参数设置
在“Design (设置)”模块中按以下参数设置相应选项(图2):
①Solve For:选择“Sample Size”,表示本分析的目的是用于计算样本量。
②Power and Alpha:Power为把握度,填写“0.90”;Alpha为检验水准,填写“0.05”。
③Sample Size/Groups:“G (Number of Groups)”设定准备比较的组平均值个数G,G必须≥2,本例填“3”;“Group Allocation Ratios”表示每组样本量分配的比例,本例选择“Equal”,即每组样本含量相等。
④Effect Size:“Input σm Using”指定假设平均值的标准差σm的输入方法,σm为F检验中所检验的平均值的变异程度,选择不同选项时,其下方将出现不同的选项。本例选择“List of mean(ui’s) from which σm is calculated”列出各组平均值计算σm;“Means (u1,u2,....,uG)”输入各组平均值,本例填“65 66 66.8”;“K (Mean Multiplier)”输入平均值倍数K。当输入多个K值时,对每个K值进行单独的分析,通过这种方式可以确定检验功效对平均值的敏感性,本例填写“1”。
⑤σ (Standard Deviation):输入组内对象间的标准差σ,σ表示相同处理组中对象与对象间的变异。方差分析假设所有分组的σ相等。本例使用误差均方的平方根计算近似标准差σ=\(\sqrt{70.89}\)=8.42。
(三) 脱失率设置
在“Reports (结果报告)”模块中,勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”,在“Dropout Rate”中填写“10%”(图3),表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。
四、结果及解释
图4列出了该研究设计的相关参数和样本量计算结果,可知共需要1659只果蝇,其中N1=N2=N3=553只果蝇。
图5“References (参考文献)”列出了该计算过程中参考的相关文献;“Report Definitions (报告定义)”列出了各个参数的具体解释;“Summary Statements (报告概述)”为整个分析报告的摘要。
图6“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N'),也是研究实际开展过程中需要达到的最低样本量,共需要1845只果蝇,其中 N1’=N2’=N3‘=615只果蝇。
图7为此次样本量估算整个过程的详细参数设置汇总。
五、结论
该案例为单因素方差分析F检验样本量计算,已知三组果蝇平均生存天数分别为65天、66天、66.8天,组内误差均方为70.89,检验水准为0.05,检验功效为0.90,则每组需要553只果蝇。若考虑10%的脱失率,则每组至少需要615只果蝇。