关键词:MedCalc; 相关分析; Kendall相关分析; 等级相关分析
一、案例分析
某社区卫生服务中心欲研究年龄与冠状动脉粥样硬化等级之间的关系,抽样调查了283例年龄≥30岁的居民,收集其年龄和冠状动脉粥样硬化等级数据。每一行为一个案例,年龄按30~39岁 (age=1)、40~49岁 (age=2)、50~59岁 (age=3) 和≥60岁 (age=4)分为4组,冠状动脉粥样硬化等级分成0级 (grade=1)、1级 (grade=2)、2级 (grade=3)和3级 (grade=4)4组。试分析冠状动脉粥样硬化等级与年龄是否相关?对数据的变量和水平进行标签赋值后部分数据如图1。本文案例可从“附件下载”处下载。
二、问题分析
本案例的分析目的是检验冠状动脉粥样硬化等级与年龄是否相关,即探究年龄与冠状动脉粥样硬化等级的相关性,两个变量均为有序多分类变量(等级变量),可以采用Kendall’s Tau-b相关性分析。但需要满足2个条件:
条件1:变量类型为:①两个定量变量;②两个有序多分类变量(等级变量);③一个有序多分类变量和一个定量变量。本案例数据的两个变量均为有序多分类资料,该条件满足。
条件2:两个变量是同一组研究对象的两个属性。本案例的两个变量(年龄和冠状动脉粥样硬化等级)是同一组研究对象的两个属性(特征),该条件满足。
三、软件操作及结果解读
(一) 适用条件判断
本案例数据满足上述条件1和条件2。
(二) Kendall’s tau-b等级相关性分析
1. 软件操作
- 选择“统计”—“相关”—“等级相关”(见图2)
- 在“等级相关”对话框,“变量Y”下选择变量“Grade”,“变量X”选择“Age”,右侧“相关系数”勾选上“Kendall tau”,点击“确定”,见图3
2. 结果解读
图4为Kendall相关分析结果,年龄与冠状动脉粥样硬化等级间的Kendall's Tau-b相关系数为0.408 (P<0.001),总体等级相关系数τ的95%的置信区间为(0.327~0.486)。
四、结论
本案例采用Kendall's Tau-b相关性分析来检验年龄与冠状动脉粥样硬化等级的相关性。Kendall's Tau-b相关系数为0.408 (95%CI为 0.327~0.486,P<0.001),即年龄与冠状动脉粥样硬化的等级有相关性,相关程度为中等,年龄越大,冠状动脉粥样硬化等级越高。
五、知识小贴士
- 两个连续变量既可以使用Pearson相关分析,也可以使用Kendall's tau-b等级相关系数描述,但后者更多适用于两个分类变量均为有序分类的情况(也可以用于有序分类变量+连续变量)。
- Kendall's Tau-b相关性分析用于检验连续性资料或有序分类资料与各处理组是否存在相关关系,此类型资料还可以使用Spearman ρ系数或Jonckheere-Terpstra趋势检验。
- Kendall's tau相关性分析是由英国统计学家Maurice Kendall于1938年提出,主要包括Somers' D、Goodman-kruskal's gamma(γ)、Kendall's tau(a、b、c)等一系列相关系数。其中,最常用的是Kendall's tau-b和Kendall's tau-c相关系数。一般认为,tau-b更适合用于即两变量分类数相等,tau-c更适合于两变量分类数不等的情况。本文主要介绍Kendall's tau-b相关性分析。