梦特云统计

医学研究之相关分析的样本量计算——Kendall τ相关系数的置信区间法

2022年3月19日星期六发布于 12:34:54 浏览：13903

原创不易，转载请注明来源，感谢！

前面介绍了“医学研究之相关分析的样本量计算——Spearman秩相关系数的置信区间法”，本文介绍Kendall τ相关系数的置信区间(Confidence Intervals for Kendall’s Tau-b Correlation)的样本量估计。Kendall τ相关系数是另一种等级相关系数，常用于反映分类变量间的相关性，适用于两个分类变量均为有序分类的情况，同样属于非参数检验，其样本量计算过程及注意事项如下。

一、案例数据

某研究者欲了解某企业职工工资水平与受教育程度(初中及以下、高中、大学及以上)的关系，预期两者的Kendall τ相关系数为0.75，希望其95%CI宽度为0.15，试估计所需的样本含量。

二、案例分析

本研究中受教育程度和工资水平均为等级资料，欲研究两者之间的关系宜采用Kendall τ相关系数。希望相关系数95%CI宽度为0.15，可采用Kendall τ相关系数的置信区间法估算样本量，估算过程需要以下几个参数：

1. 双侧置信区间宽度，本例中为0.15。

2. Kendall τ相关系数的估计值，本例为0.75。

3. 检验水准α (通常取0.01至0.1，本研究取0.05)。

4. 置信度/可信度CL(即1-α，常用0.95或0.99，本研究取0.95)。

5. 脱失率DR (通常不宜超过20%，本研究取10%)。

三、软件操作

(一) 方法选择

在左侧界面中依次选择“Procedures (程序)”—“Correlation (相关)”—Confidence Interval (置信区间法)”—“Confidence Intervals for Kendall’s Tau-b Correlation (置信区间法检验Kendall相关系数)”，见图1。

图1

(二) 参数设置

在“Design (设置)”模块中按以下参数设置相应选项(图2)：

①Solve For：选择“Sample Size”，表示本分析的目的是用于计算样本量。

②Interval Type：选择“Two-Sided”，表示使用双侧置信区间。

③Confidence Level(1-Alpha)：表示置信度CL，即为1-α，填写“0.95”。

④Width of Confidence Interval：表示双侧置信区间宽度，即从置信下限到置信上限的距离，范围介于0~2。本例填“0.15”。

⑤r (Sample Kendall’s Tau-b Correlation)：即样本Kendall相关系数的估计值，可以从既往研究、专家意见或预调查中获得，范围介于-1~1。本例填“0.75”。

图2

(三) 脱失率设置

在“Reports (结果报告)”模块中，勾选“Show Dropout-Inflated Sample Size Report (报告脱失样本量)”，在“Dropout Rate”中填写“10%”(图3)，表示按照10%的脱失率计算样本量。设置好上述参数后点击“Calculate (计算)”。

图3

四、结果及解释

图4列出了该研究设计的相关参数和样本量计算结果，可知计算的样本例数(N)为62。

图4

图5“References (参考文献)”列出了该计算过程中参考的相关文献；“Report Definitions (报告定义)”列出了各个参数的具体解释；“Summary Statements (报告概述)”为整个分析报告的摘要。

图5

图6“Dropout-Inflated Sample Size (脱失样本量)”为考虑了脱失率的样本量(N')，也是研究实际开展过程中需要达到的最低样本量，本研究中为69。

图6

图7为此次样本量估算整个过程的详细参数设置汇总。

图7

五、结论

本研究中企业职工的受教育程度和工资水平均为等级资料，使用了Kendall τ相关系数来描述工资与受教育程度的相关方向和程度。已知双侧置信区间宽度为0.15，若取检验水准0.05，则置信度为0.95，则需要62例研究对象。若考虑10%的脱失率，则至少需要69例研究对象。

End

医学研究之相关分析的样本量计算——Spearman秩相关系数的置信区间法

医学研究之相关分析的样本量计算——点二列相关系数的置信区间法

文章目录 沉浸式阅读

一、案例数据
二、案例分析
三、软件操作
四、结果及解释
五、结论