医学研究之相关分析的样本量计算——点二列相关系数的置信区间法

发布于 2022年3月19日 星期六 12:40:14 浏览:2500
原创不易,转载请注明来源,感谢!

前面介绍了“医学研究之相关分析的样本量计算——Kendall τ相关系数的置信区间法”,本文介绍点二列相关系数的置信区间(Confidence Intervals for Point Biserial Correlation)的样本量估计,点二列相关系数(ρ)是计算连续性随机变量(Y)和二分类随机变量(X)之间的积矩相关系数。点二列相关系数的置信区间的样本量计算过程及注意事项如下。

一、案例数据

某研究者欲研究性别与健康质量的关系,健康质量以连续性变量饮食指数(HEI)进行评估,预期两者的相关系数为0.7,希望其95%CI宽度为0.1,假设男女比例1:1,试估计所需的样本含量。

二、案例分析

本研究中性别为二分类变量,饮食指数为连续性变量,宜采用点二列相关系数的置信区间法,需要以下几个参数:

1. 双侧置信区间宽度,本例中为0.1。

2. 秩相关系数的估计值,本例为0.7。

3. 指定二分类变量X=1的概率,本例为0.5。

4. 检验水准α (通常取0.01至0.1,本研究取0.05)。

5. 置信度/可信度CL(即1-α,常用0.95或0.99,本研究取0.95)。

6. 脱失率DR (通常不宜超过20%,本研究取10%)。

三、软件操作

(一) 方法选择

在左侧界面中依次选择“Procedures (程序)”—“Correlation (相关)”—Confidence Interval (置信区间)”—“Confidence Intervals for Point Biserial Correlation (点二列相关系数置信区间)”,见图1。

图1

(二) 参数设置

在“Design (设置)”模块中按以下参数设置相应选项(图2):

①Solve For:选择“Sample Size”,表示本分析的目的是用于计算样本量。

②Interval Type:选择“Two-Sided”,表示使用双侧置信区间。

③Confidence Level(1-Alpha):表示置信度CL,即为1-α,填写“0.95”。

④Width of Confidence Interval:表示双侧置信区间宽度,即从置信下限到置信上限的距离,范围介于0~2。本例填“0.1”。

r(Sample Kendall’s Tau-b Correlation):即样本点二列相关系数的估计值,可以从既往研究、专家意见或预调查中获得,范围介于-1~1。本例填“0.7”。

P(Probability Dichotomous X=1):即指定二分类变量X=1的概率值,范围介于0~1。本例填“0.5”。

图2

(三) 脱失率设置

在“Reports (结果报告)”模块中,勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”,在“Dropout Rate”中填写“10%”(图3),表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。

图3

四、结果及解释

图4列出了该研究设计的相关参数和样本量计算结果,可知计算的样本总例数(N)为302。

图4

图5“References (参考文献)”列出了该计算过程中参考的相关文献;“Report Definitions (报告定义)”列出了各个参数的具体解释;“Summary Statements (报告概述)”为整个分析报告的摘要。

图5

图6“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N'),也是研究实际开展过程中需要达到的最低样本量,本研究中为336。

图6

图7为此次样本量估算整个过程的详细参数设置汇总。

图7

五、结论

本研究中性别为二分类资料,饮食指数(HEI)为连续性资料,因此使用了点二列相关系数来描述性别与HEI之间的关系。已知双侧置信区间宽度为0.1,若取检验水准0.05,则置信度为0.95,则需要302例研究对象,即男、女各需要151例。若考虑10%的脱失率,则至少需要336例研究对象,男、女各需要168例。

End
文章目录 沉浸式阅读