医学研究之回归分析的样本量计算——直线回归斜率的置信区间法

发布于 2022年3月26日 星期六 21:31:00 浏览:2689
原创不易,转载请注明来源,感谢!

前面介绍了“医学研究之回归分析的样本量计算——直线回归斜率的假设检验”,本文将介绍直线回归斜率的置信区间法(Confidence Intervals for Linear Regression Slop)的样本量计算。

关键词:样本量计算; PASS; 回归分析; 直线回归; 直线回归斜率的置信区间

一、案例数据

在研究正常儿童的尿肌酐含量(Y)与年龄(X)之间关系中,研究者计划建立一个直线回归斜率的双侧95%置信区间,期望斜率到置信限的距离不超过1个单位。估计斜率b=0.5,年龄(X)的标准差SX=1.50,根据以往研究可知残差标准差为1.64,试估计该研究所需的样本含量为多少?

二、案例分析

欲研究儿童的尿肌酐含量(Y)与年龄(X)之间关系,希望建立一个直线回归斜率的双侧95%置信区间,并期望样本斜率到置信限的距离不超过1个单位。已知估计样本的斜率b=0.5,年龄(X)的标准差SX=1.50,残差标准差为1.64,宜采用直线回归斜率的置信区间。直线回归斜率的置信区间样本量估算,需要以下几个参数:

1. X值的样本标准差SX

2. 残差的样本标准差S。

3. 样本斜率值b

4. 样本斜率b到置信限的距离。

5. 检验水准α (通常取0.01至0.1,本例为0.05)。

6. 脱失率DR (通常不宜超过20%,本例取10%)。

三、软件操作

(一) 方法选择

在左侧界面中依次选择“Procedures (程序)”—“Regression (回归)”—“Linear Regression (线性回归)”—“Confidence Intervals for Linear Regression Slope (直线回归斜率的置信区间法)”见图1。

图1

(二) 参数设置

在“Design (设置)”模块中按以下参数设置相应选项(图2):

① Solve For:“Sample Size”表示本分析的目的是用于计算样本量。

② One-sided or Two-Sided Interval:“Interval Type”表示置信区间的类型,本例选择“Two-Sided”双侧置信区间。

③ Confidence:“Confidence Level (1-Alpha)”置信度,本例为0.95。

④ Precision:“Distance from Slop to Limit(s)”设定样本斜率b到置信限的距离,本例为“1.0”。

⑤ Slop:“B(Slope)”表示样本斜率b的大小,本例为“0.5”。

⑥ Standard Deviation of X’s:“SX(Standard Deviation of X’s)”设定X的标准差SX,本例为“1.50”。

⑦ Residual Variance Calculation:“Residual Variance Method”表示选择残差标准差的计算方法,PASS提供了3种方法指定残差的标准差,可选择“SY(Std.Dev.of Y)” (根据Y的标准差估计值SY指定残差标准差)、“R (Correlation)” (根据Y和X之间的相关性估计值指定残差标准差)和“S (Std.Dev.of Residual)” (输入残差标准差的估计值),本例选择“S (Std.Dev.of Residual)”,表示残差标准差,本例填“1.64”。

图2

(三) 脱失率设置

在“Reports (结果报告)”模块中,勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”,在“Dropout Rate”中填写“10%”(图3),表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。

图3

四、结果及解释

图4列出了该研究设计的相关参数和样本量计算结果,可知计算的样本例数(N)为9。

图4

图5“References (参考文献)”列出了该计算过程中参考的相关文献;“Report Definitions (报告定义)”列出了各个参数的具体解释;“Summary Statements (报告概述)”为整个分析报告的摘要。

图5

图6“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N'),也是研究实际开展过程中需要达到的最低样本量,本研究中至少需要10例儿童。

图6

图7为此次样本量估算整个过程的详细参数设置汇总。

图7

五、结论

该案例为直线回归斜率的置信区间法进行样本含量计算。欲研究儿童尿肌酐含量(Y)与年龄(X)之间的关系,希望建立一个直线回归斜率的双侧95%置信区间,并期望斜率到置信限的距离不超过1个单位。已知估计斜率b=0.5,年龄(X)的标准差SX=1.50,残差标准差为1.64,则需要9例儿童。若考虑10%的脱失率,则至少需要10例儿童。

End
文章目录 沉浸式阅读