医学研究之回归分析的样本量计算——两直线回归斜率的差异性检验

2022年3月26日星期六发布于 21:35:05 浏览：4361

原创不易，转载请注明来源，感谢！

前面介绍了“医学研究之回归分析的样本量计算——直线回归斜率的置信区间法”，本文主要介绍两直线回归斜率的差异性检验(Tests for the Difference Between Two Linear Regression Slopes)的样本量估计。

关键词：样本量计算; PASS; 回归分析; 直线回归; 回归斜率比较的样本量计算

与单个直线回归斜率的假设检验不同，两直线回归斜率的差异性检验是在两个分组中分别拟合回归方程，假设残差ε服从正态分布，进行两条直线回归斜率是否相等的假设检验。具体计算过程及注意事项如下。

一、案例数据

对于某两个有相关关系的变量X和Y，根据过去(组1)和近期(组2)的观测数据构建了两条回归直线。欲比较两条回归直线的斜率，已知两直线的斜率差为0.7。根据既往研究可知，残差标准差为1.5，组1和组2样本中X值的标准差σ_{_X}₁、σ_{_X}₂分别为2和1.5。取α =0.05，β=0.1，试估计所需的样本含量。

二、案例分析

本研究中已知两变量存在相关关系，继而拟合两条回归直线，欲比较两直线斜率是否相等，采用两直线回归斜率的差异性检验，其样本量计算需要以下几个参数：

1. 两组回归直线的斜率差值，本例中为0.7。

2. 残差标准差，本例为1.5。

3. 组1自变量的标准差，本例为σ_{_X}₁=2.0。

4. 组2自变量的标准差，本例为σ_{_X}₂=1.5。

5. 检验水准α (通常取0.01至0.1，本研究取0.05)。

6. 检验功效1-β (通常为0.8或更高，本研究取0.9)。

7. 脱失率DR (通常不宜超过20%，本研究取10%)。

三、软件操作

(一) 方法选择

在左侧界面中依次选择“Procedures (程序)”—“Regression (回归)”—“Linear Regression (直线回归)”—“Tests for the Difference Between Two Linear Regression Slopes (两直线回归斜率的差异性检验)”，见图1。

(二) 参数设置

在“Design (设置)”模块中按以下参数设置相应选项(图2)：

①Solve For：选择“Sample Size”，表示本分析的目的是用于计算样本量。

②Alternative Hypothesis：指定备择假设的单双侧及假设检验的方向。选择“Ha：δ≠0”，表示进行备择假设为H_₁：δ≠0的双侧检验。

③Power and Alpha：Power为把握度，填写“0.90”；Alpha为检验水准，填写“0.05”。

④Group Allocation：选择“Equal (N1=N2)”，表示每组的样本量相等。

⑤δ (β1-β2, Slope Difference)：即两组回归直线斜率的假设检验差值，可为任意非零差值。本例填“0.7”。

⑥σ (SD of Residuals)：即因变量Y在自变量X上回归的残差的一个或多个标准差值。作为残差均方(MSE)的平方根，可以从既往研究中得到。该值须为正值。本例填“1.5”。

⑦σX1 (SD of X in Group 1)：即使用总体公式计算的组1样本中自变量X的标准差(平方和除以n，而不是n-1)，须为正值。本例填“2.0”。

⑧σX2 (SD of X in Group 2)：即使用总体公式计算的组2样本中自变量X的标准差(平方和除以n，而不是n-1)，须为正值。本例填“1.5”。

(三) 脱失率设置

在“Reports (结果报告)”模块中，勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”，在“Dropout Rate”中填写“10%”(图3)，表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。

四、结果及解释

图4列出了该研究设计的相关参数和样本量计算结果，可知计算的每组样本数(N)分别为35。

图5“References (参考文献)”列出了该计算过程中参考的相关文献；“Report Definitions (报告定义)”列出了各个参数的具体解释；“Summary Statements (报告概述)”为整个分析报告的摘要。

图6“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N')，也是研究实际开展过程中需要达到的最低样本量，本研究中每组样本数分别为39。

图7为此次样本量估算整个过程的详细参数设置汇总。

五、结论

本研究中已知两变量存在相关关系，继而根据过去(组1)和近期(组2)的观测数据拟合两条回归直线。欲比较两直线的斜率，假设两条直线斜率差值为0.7，两组自变量X的标准差分别为2.0和1.5，残差标准差为1.5，若取检验水准0.05，检验功效0.90，至少每组样本数分别为35。若考虑10%的脱失率，则每组样本数分别为39。

我要纠错

End

医学研究之回归分析的样本量计算——直线回归斜率的置信区间法

医学研究之回归分析的样本量计算——两直线回归截距的差异性检验