关键词:SPSS; 相关分析; Spearman相关分析; 连续变量相关分析; Spearman相关系数; 等级相关分析; 秩相关
一、案例介绍
某医师收集了224例肺癌患者的生存时间(Time)和患者自评的卡氏评分(pat.karno)。问患者自评的卡氏评分与其生存时间是否相关。
创建代表生存时间的变量“Time”和代表患者自评的卡氏评分的变量“pat.karno”,测量尺度均设为“标度”。对数据的变量和水平进行标签赋值后部分数据见图1。本文案例可从“附件下载”处下载。
二、问题分析
本案例的分析目的是检验患者自评的卡氏评分与其生存时间是否相关,即探究自评卡氏评分与生存时间的相关性,两个变量均为定量变量,可以采用Pearson相关性分析或Spearman相关性分析。若使用Spearman相关性分析需要满足两个条件:
条件1:两个定量变量中至少有一个为非正态分布或总体分布未知或为等级资料。
条件2:两变量之间为单调关系。
三、软件操作及结果解读
(一) 适用条件判断
1. 条件1判断(正态性检验)
(1) 软件操作
① 选择“分析”—“描述统计”—“探索”(图2)。
在“探索”对话框中将变量“Time”和“pat.karno”选入右侧“因变量列表”框(图3)。
③ 点击“图 ”,在“图 ”对话框中取消勾选“茎叶图”,勾选“含检验的正态图”,点击“继续 ”(图4),回到主对话框后点击“确定”。
(2) 结果解读
图5和图6-1、图6-2给出了正态分布的假设检验结果和Q-Q图。图5的正态性检验结果两个变量的正态性检验的P值均<0.001,提示不满足正态性要求。图6-1和图6-2的Q-Q图上两个变量的散点偏离对角线分布较多,也提示两个变量不服从正态分布;综上,本案例满足条件1,即为数据不服从正态分布。
关于正态性检验的注意事项详见推文(医学统计学核心概念及重要假设检验的软件实现(2/4)——正态性假设检验的SPSS实现)。
2. 条件2判断(单调性)
(1) 软件操作
①选择“图”—“旧对话框”—“散点图/点图…” (图7)。
②在“散点图/点图…”对话框中选择第一种“简单散点图”(图3),然后点击“定义”,出现主对话框。
③在“简单散点图”主对话框中将变量“Time”选入右侧Y轴中,将变量“pat.karno”选入右侧X轴中(图9),点击“确定”则会输出结果。
(2) 结果解读
图10给出了单调性的图示结果。由图10的散点可知,生存时间随卡氏评分的增加而增加,呈单调关系,即本案例数据满足条件2。
(二) 统计描述及推断
1. 软件操作
① 选择“分析”—“相关”—“双变量” (图11)。
②在“双变量相关性”对话框中将变量“Time”和“pat.karno”选入右侧“变量”框,选择相关系数中的“斯皮尔曼(Spearman)”,其他设置如图12所示,点击“确定”。
2. 结果解读
图13“相关性”中给出了患者自评卡氏评分(pat.karno)与生存时间(Time)的Spearman相关系数和假设检验的P值。可知,患者的自评卡氏评分与生存时间有相关性,Spearman相关系数rs=0.220,P<0.001,两变量间呈弱相关。
四、结论
本研究采用Spearman相关性分析对患者自评卡氏评分(pat.karno)与生存时间(Time)的相关性进行了检验。通过Q-Q图和Shapiro-Wilk检验,提示数据为偏态分布,通过绘制散点图显示两变量之间呈单调关系。
Spearman相关性分析结果显示,患者的自评卡氏评分与生存时间之间为正相关(rs=0.220,P<0.001),卡氏评分越高,患者的生存时间越长,但相关性程度较弱。
五、分析小技巧
- Spearman相关,又称秩相关、等级相关,是对两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围较广。对于服从Pearson相关的数据亦可计算Spearman相关系数,但统计效能更低。
- Spearman相关系数(rs)介于-1与1之间,rs >0为正相关,rs <0为负相关。rs的绝对值(|rs|)越大,变量间的相关性越强。
- 参考Pearson相关系数对rs进行等级划分:当0.9</r/<1,为高度相关;当0.7</r/<0.9,为强相关;0.4</r/<0.7,为中度相关;0.2</r/<0.4,为弱相关性;0</r/<0.2,为极弱相关或无相关性。