医学研究之回归分析的样本量计算——多重线性回归分析的效应大小法

2022年3月28日星期一发布于 12:13:29 浏览：10954

原创不易，转载请注明来源，感谢！

前面介绍了“医学研究之回归分析的样本量计算——多重线性回归分析的决定系数法”，本文将介绍使用效应大小的多重线性回归(Multiple Linear Regression using Effect Size)的样本量计算。Cohen (1988)使用决定系数R^²定义了效应大小ƒ²，ƒ²=\(\frac{R 2}{1-R 2}\)。

关键词：样本量计算; PASS; 回归分析; 直线回归; 多重线性回归分析的样本量计算

一、案例数据

某研究者开展多重线性回归研究，共包含4个自变量，该研究者欲研究其中某个自变量X对整体F检验的影响。研究实施前已知自变量X值大小，取α=0.05、β=0.10，试确定效应为小、中、大时所需要的样本含量。

二、案例分析

已知多重线性回归研究中共包含4个自变量，欲研究其中某个自变量对整体F检验的影响，且已知自变量X值大小，希望确定效应为小、中、大时所需的样本含量，宜采用条件模型建立多重回归，利用多重回归的效应大小法进行样本量估算，需要以下几个参数：

1. 控制自变量集的变量数k_C。

2. 显著性检验自变量集的变量数k_T。

3. 效应大小ƒ²。

4. 检验水准α (通常取0.01至0.1，本例为0.05)。

5. 检验功效1-β (通常为0.80或更高，本研究取0.90)。

6. 脱失率DR (通常不宜超过20%，本例取10%)。

三、软件操作

(一) 方法选择

在左侧界面中依次选择“Procedures (程序)”—“Regression (回归)”—“Multiple Regression (多重回归)”—“Multiple Regression using Effect Size (使用效应大小的多重回归)”见图1。

(二) 参数设置

在“Design (设置)”模块中按以下参数设置相应选项(图2)：

① Solve For：“Sample Size”表示本分析的目的是用于计算样本量。

② Power and Alpha：Power为把握度，填写“0.90”；Alpha为检验水准，填写“0.05”。

③ Effect Size：“Regression Model Type” 表示多元回归模型建立的两种方法，包括【Unconditional (Random X's)】无条件法和【Conditional (Fixed X's)】条件法。无条件法假设Y和X服从多元正态分布，因此在研究过程中直到观察到X值才能知道X的值，是最实际的方法。条件法假设X值在计划阶段已知，本例选择“Conditional (Fixed X’s)”条件假设X值。

④ C：Independent Variable (X’s) Controlled：“k_C (Number of X’s Controlled)”表示控制自变量集的变量数k_C，本例填“3”。

⑤ T：Independent Variable (X’s) Tested：“k_T (Number of X’s Tested)”表示显著性检验自变量集的变量数k_T，本例填“1”。

⑥ ƒ²：设置效应大小参数值，本例小、中、大效应值分别为0.02、0.15和0.35。

(三) 脱失率设置

在“Reports (结果报告)”模块中，勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”，在“Dropout Rate”中填写“10%”(图3)，表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。

四、结果及解释

图4列出了该研究设计的相关参数和样本量计算结果，可知计算的效应为小、中、大时样本例数(N)分别为528、73和33。

图5“References (参考文献)”列出了该计算过程中参考的相关文献；“Report Definitions (报告定义)”列出了各个参数的具体解释；“Summary Statements (报告概述)”为整个分析报告的摘要。

图6“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N')，也是研究实际开展过程中需要达到的最低样本量，本研究中效应为小、中、大时分别至少为587、82和37。

图7为此次样本量估算整个过程的详细参数设置汇总。

五、结论

该案例为使用效应大小的多重回归计算样本含量。已知多重回归研究共包含4个自变量，该研究者欲研究其中某个自变量对整体F检验的影响。研究实施前已知X值大小，取α=0.05、β=0.10，则效应为小、中、大时所需要样本量分别至少为528、73和33。若考虑10%的脱失率，则效应为小、中、大时所需要样本量分别至少为587、82和37。

我要纠错

End

医学研究之回归分析的样本量计算——多重线性回归分析的决定系数法