医学研究之相关分析的样本量计算——Pearson相关系数的置信区间法

发布于 2022年3月19日 星期六 10:24:38 浏览:7541
原创不易,转载请注明来源,感谢!

本文将介绍Pearson相关系数的置信区间(Confidence Intervals for Pearson’s Correlation)的样本量计算,其计算过程及注意事项如下。

一、案例数据

某研究者欲探究儿童尿肌酐含量(Y)与年龄(X)之间的关系。由以往研究可知两者相关系数为0.3,其总体相关系数的95%CI宽度为0.15。试估计该研究所需要的样本含量是多少? 

二、案例分析

欲研究儿童尿肌酐和年龄之间的关系,且双变量服从正态分布,已知估计的相关系数和总体相关系数置信区间的宽度,宜采用Pearson相关系数的置信区间法。Pearson相关系数的置信区间样本量估算,需要以下几个参数:

1. Pearson积矩相关系数的估计值r,该值可通过以往研究、专家意见和合理预实验获得。

2. 置信区间宽度,即从置信区间下限到上限的距离,该值必须介于0~2之间。

3. 置信度,即1-αα通常取0.05,本例1-α为0.95。

4. 脱失率DR (通常不宜超过20%,本例取10%)。

三、软件操作

(一) 方法选择

在左侧界面中依次选择“Procedures (程序)”—“Correlation (相关)”—“Confidence Interval (置信区间)”—“Confidence Intervals for Pearson’s Correlation (Pearson相关系数的置信区间)”见图1。

图1

(二) 参数设置

在“Design (设置)”模块中按以下参数设置相应选项(图2):

① Solve For:选择“Sample Size”,表示本分析的目的是用于计算样本量。

② Interval Type:指定区间类型,本例选择“Two-Sided”表示双侧置信区间。

③ Confidence:“Confidence Level (1-Alpha)”表示置信度,本例填写“0.95”。

④ Precision:“Width of Confidence Interval”表示置信区间的宽度,本例填写“0.15”。

⑤ Estimated Sample Correlations:“r ( Sample Correlation)”表示样本Pearson积矩相关系数的估计值r,该值可通过以往研究、专家意见和合理猜测获得。该值必须介于-1~1之间,本例填写“0.3”。

图2

(三) 脱失率设置

在“Reports (结果报告)”模块中,勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”,在“Dropout Rate”中填写“10%”(图3),表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。

图3

四、结果及解释

图4列出了该研究设计的相关参数和样本量计算结果,可知计算的样本例数(N)为567。

图4

图5“References (参考文献)”列出了该计算过程中参考的相关文献;“Report Definitions (报告定义)”列出了各个参数的具体解释;“Summary Statements (报告概述)”为整个分析报告的摘要。

图5

图6“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N'),也是研究实际开展过程中需要达到的最低样本量,本研究中为630。

图6

图7为此次样本量估算整个过程的详细参数设置汇总。

图7

五、结论

该案例为Pearson相关系数的置信区间法进行样本含量计算。已知儿童尿肌酐含量与年龄的相关系数为0.3,其总体相关系数的95%CI宽度为0.15,则至少需要567例研究对象。若考虑10%的脱失率,则至少需要630例研究对象。

End
文章目录 沉浸式阅读