一、案例数据
某研究者欲探究儿童尿肌酐含量(Y)与年龄(X)之间的关系。由以往研究可知两者相关系数为0.3,其总体相关系数的95%CI宽度为0.15。试估计该研究所需要的样本含量是多少?
二、案例分析
欲研究儿童尿肌酐和年龄之间的关系,且双变量服从正态分布,已知估计的相关系数和总体相关系数置信区间的宽度,宜采用Pearson相关系数的置信区间法。Pearson相关系数的置信区间样本量估算,需要以下几个参数:
1. Pearson积矩相关系数的估计值r,该值可通过以往研究、专家意见和合理预实验获得。
2. 置信区间宽度,即从置信区间下限到上限的距离,该值必须介于0~2之间。
3. 置信度,即1-α,α通常取0.05,本例1-α为0.95。
4. 脱失率DR (通常不宜超过20%,本例取10%)。
三、软件操作
(一) 方法选择
在左侧界面中依次选择“Procedures (程序)”—“Correlation (相关)”—“Confidence Interval (置信区间)”—“Confidence Intervals for Pearson’s Correlation (Pearson相关系数的置信区间)”见图1。
(二) 参数设置
在“Design (设置)”模块中按以下参数设置相应选项(图2):
① Solve For:选择“Sample Size”,表示本分析的目的是用于计算样本量。
② Interval Type:指定区间类型,本例选择“Two-Sided”表示双侧置信区间。
③ Confidence:“Confidence Level (1-Alpha)”表示置信度,本例填写“0.95”。
④ Precision:“Width of Confidence Interval”表示置信区间的宽度,本例填写“0.15”。
⑤ Estimated Sample Correlations:“r ( Sample Correlation)”表示样本Pearson积矩相关系数的估计值r,该值可通过以往研究、专家意见和合理猜测获得。该值必须介于-1~1之间,本例填写“0.3”。
(三) 脱失率设置
在“Reports (结果报告)”模块中,勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”,在“Dropout Rate”中填写“10%”(图3),表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。
四、结果及解释
图4列出了该研究设计的相关参数和样本量计算结果,可知计算的样本例数(N)为567。
图5“References (参考文献)”列出了该计算过程中参考的相关文献;“Report Definitions (报告定义)”列出了各个参数的具体解释;“Summary Statements (报告概述)”为整个分析报告的摘要。
图6“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N'),也是研究实际开展过程中需要达到的最低样本量,本研究中为630。
图7为此次样本量估算整个过程的详细参数设置汇总。
五、结论
该案例为Pearson相关系数的置信区间法进行样本含量计算。已知儿童尿肌酐含量与年龄的相关系数为0.3,其总体相关系数的95%CI宽度为0.15,则至少需要567例研究对象。若考虑10%的脱失率,则至少需要630例研究对象。