Spearman相关性分析(Spearman Correlation Analysis)——SAS软件实现

发布于 2021年12月30日 星期四 14:10:47 浏览:5326
原创不易,转载请注明来源,感谢!
附件下载:
Spearman相关性分析.zip 请勿重复点击,如无响应请耐心等待或稍后再试。

在前面文章中我们介绍了Spearman相关性分析(Spearman Correlation Analysis)的假设检验理论,本篇文章将实例演示在SPSS软件中实现Spearman相关性分析的操作步骤。

关键词:SAS; 相关分析; Spearman相关分析; 连续变量相关分析; Spearman相关系数; 等级相关分析; 秩相关

一、案例介绍

某医师收集了224例肺癌患者的生存时间(Time)和患者自评的卡氏评分(pat_karno)。问患者自评的卡氏评分与其生存时间是否相关。部分数据见图1。本文案例可从“附件下载”处下载。

图1

二、问题分析

本案例的分析目的是检验患者自评的卡氏评分与其生存时间是否相关,即探究自评卡氏评分与生存时间的相关性,两个变量均为定量变量,可以采用Pearson相关性分析或Spearman相关性分析。若使用Spearman相关性分析需要满足两个条件:

条件1:两个定量变量中至少有一个为非正态分布或总体分布未知或为等级资料。

条件2:两变量之间为单调关系。

三、软件操作及结果解读

(一) 适用条件判断

1. 条件1判断(正态性检验)

(1) SAS实现
proc univariate data=data1 normal;
	var time pat_karno;
run;

其中,normal选项表示对变量做正态性检验。

(2) 结果解读

图2和图3分别列出了患者生存时间(Time)和患者自评卡氏评分(pat_karno)的正态性检验结果。Shapiro-Wilk正态性检验的P值均<0.0001,提示两个变量均不服从正态分布。

图2
图3

2. 条件2判断(单调性)

(1) SAS实现
proc sgplot data=data1;
	scatter x=pat_karno y=time;
run;
(2) 结果解读

由图4的散点图可知,生存时间随卡氏评分的增加而增加,呈单调关系,即本案例数据满足条件2。

图4

(二) 统计描述及推断

1. SAS实现

proc corr data=data1 spearman;
		var time pat_karno;
run;

2. 结果解读

Spearman相关性分析的结果很简单,主要分为三部分。如图5所示。

第一部分是列出了进行相关性分析的变量,分别是Time、pat_karno。

第二部分是对变量进行描述,给出了数目、均值、标准差、中位数、最小值、最大值等统计指标。

第三部分是Spearman相关性分析的结果,给出了相关系数和P值。如图5所示,患者的自评卡氏评分与生存时间有相关性,Spearman相关系数=0.22029,P=0.0009,两变量间呈正相关。

图5

四、结论

本研究采用Spearman相关性分析对患者自评卡氏评分(pat_karno)与生存时间(Time)的相关性进行了检验。通过Shapiro-Wilk检验,提示数据为偏态分布,通过绘制散点图显示两变量之间呈单调关系。

Spearman相关性分析结果显示,患者的自评卡氏评分与生存时间之间为正相关(rs=0.22029,P=0.0009),卡氏评分越高,患者的生存时间越长,但相关性程度较弱。

五、分析小技巧

  • Spearman相关,又称秩相关、等级相关,是对两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围较广。对于服从Pearson相关的数据亦可计算Spearman相关系数,但统计效能更低。
  • Spearman相关系数(rs)介于-1与1之间,rs >0为正相关,rs <0为负相关。rs的绝对值(|rs|)越大,变量间的相关性越强。
  • 参考Pearson相关系数对rs进行等级划分:当0.9</r/<1,为高度相关;当0.7</r/<0.9,为强相关;0.4</r/<0.7,为中度相关;0.2</r/<0.4,为弱相关性;0</r/<0.2,为极弱相关或无相关性
End
文章目录 沉浸式阅读