关键词:jamovi; 相关分析; Kendall相关分析; 肯德尔相关分析; Kendall相关系数; 肯德尔相关系数; 等级相关分析
一、案例介绍
某社区卫生服务中心欲研究年龄与冠状动脉粥样硬化等级之间的关系,抽样调查了283例年龄≥30岁的居民,收集其年龄和冠状动脉粥样硬化等级数据。年龄按30~39岁、40~49岁、50~59岁、≥60岁统计频数,冠状动脉粥样硬化按照0级、1级、2级、3级统计频数。问冠状动脉粥样硬化等级与年龄是否相关?部分数据见表1。本案例数据可从“附件下载”处下载。
二、问题分析
本案例的分析目的是检验冠状动脉粥样硬化等级与年龄是否相关,即探究年龄与冠状动脉粥样硬化等级的相关性,两个变量均为有序多分类变量(等级变量),可以采用Kendall’s Tau-b相关性分析。但需要满足两个条件:
条件1:变量类型为两个定量变量或两个有序多分类变量(等级变量)或一个有序多分类变量和一个定量变量。本案例数据的两个变量均为有序多分类资料,该条件满足。
条件2:两个变量是同一组研究对象的两个属性。本案例的两个变量(年龄和冠状动脉粥样硬化等级)是同一组研究对象的两个属性(特征),该条件满足。
三、软件操作及结果解读
(一) 适用条件判断
本案例数据满足上述条件1和条件2。
(二) 统计描述及推断
1. 软件操作
对于已经汇总好的频数资料,可以通过独立样本χ2 检验来进行Kendall’s Tau-b检验,步骤如下:
选择“分析”—“频数”—“独立样本χ2关联检验”,见图2。
将变量“年龄”“等级”和“频数”选入右侧相应的变量框内(图3)。
在“统计”下的“定序”中勾选 “Kendall’s tau-b系数”;在“单元格”下的“计数”中勾选“实际频数”,在“百分比”下勾选“行”和“列”(图4),结果见图5、图6。
2. 结果解读
(1) 统计描述
“列联表”(图5)中给出了不同年龄组中冠状动脉粥样硬化的等级构成情况,和不同等级冠状动脉粥样硬化组中年龄的构成情况。如,在30~39岁组内,冠状动脉粥样硬化等级为1的比例为23.0%(23/100);在冠状动脉粥样硬化等级为1的患者中30~39岁的占25.3%(23/91)。
(2) 统计推断
“Kendall’s Tau-b系数”(图6)显示,年龄与冠状动脉粥样硬化等级间的Kendall’s Tau-b相关系数为0.410 (t=8.080,P<0.001),即年龄与冠状动脉粥样硬化的等级有相关性,且为正相关;参考Pearson相关系数的强弱判断,年龄与冠状动脉粥样硬化的程度为中度相关。
四、结论
本研究采用Kendall’s Tau-b相关性分析检验年龄与冠状动脉粥样硬化等级的相关性,两变量均为有序分类资料,且均为一组研究对象的两个属性,满足Kendall’s Tau-b相关性分析的条件。
Kendall’s Tau-b相关性分析结果表明,年龄与冠状动脉粥样硬化等级呈正相关,相关系数为0.410 (t=8.080,P<0.001)。表明年龄越大,发生冠状动脉粥样硬化的等级越高,相关程度为中等。
五、分析小技巧
在jamovi中,还可以通过“分析”—“回归”—“相关矩阵”进行Kendall’s tau-b相关性分析,但数据形式不是本案例所用的频数汇总数据,而是每一行为一个患者情况的长数据,见图7。
两个连续变量间呈线性相关时,可以使用Pearson相关分析,不满足Pearson相关分析的适用条件时,可以使用Spearman相关系数来描述。
两个连续变量既可以使用Pearson相关分析,也可以使用Kendall's Tau-b等级相关系数描述,但后者更多适用于两个分类变量均为有序分类的情况(也可以用于有序分类变量+连续变量)。