Kendall’s Tau-b相关性分析(Kendall’s Tau-b Correlation Analysis)——SPSS软件实现

发布于 2021年12月30日 星期四 15:40:47 浏览:5092
原创不易,转载请注明来源,感谢!
附件下载:
Kendall’s Tau-b相关性分析.zip 请勿重复点击,如无响应请耐心等待或稍后再试。

在前面文章中介绍了Kendall’s Tau-b相关性分析的假设检验理论,本文将实例演示在SPSS软件中实现Kendall’s Tau-b相关性分析的操作步骤。

关键词:SPSS; 相关分析; Kendall相关分析; 肯德尔相关分析; Kendall相关系数; 肯德尔相关系数; 等级相关分析

一、案例介绍

某社区卫生服务中心欲研究年龄与冠状动脉粥样硬化等级之间的关系,抽样调查了283例年龄≥30岁的居民,收集其年龄和冠状动脉粥样硬化等级数据。年龄按30-39岁、40-49岁、50-59岁、≥60岁统计频数,冠状动脉粥样硬化按照0级、1级、2级、3级统计频数。问冠状动脉粥样硬化等级与年龄是否相关?

创建代表受试者年龄的变量“Age”,代表冠状动脉粥样硬化等级的变量“Grade”,代表等级频数的变量“Frequency”,测量尺度均设为“标度”。对数据的变量和水平进行标签赋值后部分数据见图1。本文案例可从“附件下载”处下载。

图1

二、问题分析

本案例的分析目的是检验冠状动脉粥样硬化等级与年龄是否相关,即探究年龄与冠状动脉粥样硬化等级的相关性,两个变量均为有序多分类变量(等级变量),可以采用Kendall’s Tau-b相关性分析。但需要满足2个条件:

条件1:变量类型为,①两个定量变量,②两个有序多分类变量(等级变量),③一个有序多分类变量和一个定量变量。本案例数据的两个变量均为有序多分类资料,该条件满足。

条件2:两个变量是同一组研究对象的两个属性。本案例的两个变量(年龄和冠状动脉粥样硬化等级)是同一组研究对象的两个属性(特征),该条件满足。

三、软件操作及结果解读

(一) 适用条件判断

本案例数据满足上述条件1和条件2。

(二) 统计描述及推断

对于已经汇总好的频数资料,可以通过独立样本χ2 检验来进行Kendall’s Tau-b检验。首先进行数据加权,步骤如下:

1. 软件操作

① 选择“数据”—“个案加权”(图2)。

图2

②在“个案加权”对话框中选择“个案加权依据”,将左侧变量“Frequency ”选入右侧“频数变量”框中,点击“确定”,则完成数据加权(图3)。

图3

加权个案后进行χ2检验。

③选择“分析”—“描述统计”—“交叉表”(图4)。

图4

④出现“交叉表”对话框,将分组变量“Age”和“Grade”分别放入右侧“行”和“列” (图5),“行”和“列”中的变量可以互换位置,不影响检验结果。

图5

⑤点击图5“交叉表”对话框右侧“统计”,在“交叉表:统计”对话框中勾选“肯德尔tau_b(Kendall’s Tau-b)”,然后点击“继续(图6)”,回到“交叉表”对话框。

图6

⑥点击图5“交叉表”对话框右侧“单元格”,在“交叉表:单元格显示”对话框中勾选“实测”,在“百分比”下勾选“行”和“列”,然后点击“继续”(图7),回到“交叉表”对话框,点击“确定”,则得到检验结果。

图7

2. 结果解读

(1) 统计描述

图8年龄和等级的“交叉表”中给出了不同年龄组中动脉粥样硬化的等级构成情况,和不同等级动脉粥样硬化组中年龄的构成情况。如,在年龄“30-39”岁组内,动脉粥样硬化等级为“1”的比例为23.0% (23/100);在动脉粥样硬化等级为“1”的患者中年龄“30-39”岁的占25.3% (23/91)。

图8
(2) 统计推断

由图9的结果可知,年龄与动脉粥样硬化等级间的Kendall’s Tau-b相关系数为0.410(P<0.001),即年龄与动脉粥样硬化的等级有相关性,且为正相关;参考Pearson相关系数的强弱判断,年龄与动脉粥样硬化的程度为中度相关。

图9

四、结论

本研究采用Kendall’s Tau-b相关性分析检验年龄与动脉粥样硬化等级的相关性,两变量均为有序分类资料,且均为一组研究对象的两个属性,满足Kendall’s Tau-b相关性分析的条件。

Kendall’s Tau-b相关性分析结果表明,年龄与动脉粥样硬化等级呈正相关,相关系数为0.410 (P<0.001)。表明,年龄越大,发生动脉粥样硬化的等级越高。相关程度为中等。

五、分析小技巧

  • 两个连续变量间呈线性相关时,可以使用Pearson相关分析,不满足Pearson相关分析的适用条件时,可以使用Spearman相关系数来描述。
  • 两个连续变量既可以使用Pearson相关分析,也可以使用Kendall's tau-b等级相关系数描述,但后者更多适用于两个分类变量均为有序分类的情况(也可以用于有序分类变量+连续变量)。
  • 在SPSS中,还可以通过“分析”—“相关”—“双变量”,然后在“双变量相关性”对话框中将变量选入相应变量框后,在下方的“相关系数”中选择“Kendall’s tau-b”。但数据形式不是本案例所用的频数汇总数据,而是每一行为一个患者情况的长数据。
End
文章目录 沉浸式阅读