关键词:jamovi; 相关分析; Spearman相关分析; 连续变量相关分析; Spearman相关系数; 等级相关分析; 秩相关
Spearman相关,又称秩相关、等级相关,是对两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围较广。对于服从Pearson相关的数据亦可计算Spearman相关系数,但统计效能更低。
Spearman相关系数(rs)介于-1与1之间,rs >0为正相关,rs <0为负相关。rs的绝对值(|rs|)越大,变量间的相关性越强。
参考Pearson相关系数对rs进行等级划分:当0.9≤|r|<1,为高度相关;当0.7≤|r|<0.9,为强相关;0.4≤|r|<0.7,为中度相关;0.2≤|r|<0.4,为弱相关性;0≤|r|<0.2,为极弱相关或无相关性
一、案例介绍
某医师收集了224例肺癌患者的生存时间(Time)和患者自评的卡氏评分(pat.karno)。问患者自评的卡氏评分与其生存时间是否相关。部分数据见图1。本案例数据可从“附件下载”处下载。
二、问题分析
本案例的分析目的是检验患者自评的卡氏评分与其生存时间是否相关,即探究自评卡氏评分与生存时间的相关性,两个变量均为定量变量,可以采用Pearson相关性分析或Spearman相关性分析。若使用Spearman相关性分析需要满足以下条件:
条件1:两个定量变量中至少有一个为非正态分布或总体分布未知或为等级资料。需通过分析后判断。
三、软件操作及结果解读
(一) 适用条件判断
1. 软件操作
选择“分析”—“探索”—“描述”,将变量Time和pat.karno选入右侧“变量”框(图2)。
在“绘图”下的“绘制Q-Q图”中勾选“Q-Q图”,结果见图3-1、图3-2。
在“统计分析”中勾选“Shapiro-Wilk (夏皮罗-威尔克正态性)”,结果见图4。
2. 结果解读
图3-1、图3-2和图4给出了正态分布的图示和假设检验结果。图3-1和图3-2的Q-Q图上两个变量的散点偏离对角线分布的较多,提示两个变量不服从正态分布;图4的正态性检验结果两个变量的正态性检验的P值均<0.001,也提示不满足正态性要求。综上,本案例满足条件1,即为数据不服从正态分布。
(二) 统计描述及推断
1. 软件操作
选择“分析”—“回归”—“相关矩阵”;将变量Time和pat.karno选入右侧“变量”框。
在“相关系数”中勾选“Spearman系数”,“假设检验”中勾选“相关”,在“附加选项”中勾选“报告P值”“标记有统计学意义的相关”“个案数”“置信区间”(图5),结果见图6。
2. 结果解读
“相关矩阵”(图6)中给出了患者自评卡氏评分(pat.karno)与生存时间(Time)的Spearman相关系数和假设检验的P值。可知,患者的自评卡氏评分与生存时间有相关性,Spearman相关系数rs=0.220,P<0.001,两变量间呈弱相关。
四、结论
本研究采用Spearman相关性分析对患者自评卡氏评分(pat.karno)与生存时间(Time)的相关性进行了检验。通过Q-Q图和Shapiro-Wilk检验,提示数据为偏态分布,通过绘制散点图显示两变量之间呈单调关系。
Spearman相关性分析结果显示,患者的自评卡氏评分与生存时间之间为正相关(rs=0.220,P<0.001),卡氏评分越高,患者的生存时间越长,但相关性程度较弱。