关键词:Stata; 相关分析; Spearman相关分析; 连续变量相关分析; Spearman相关系数; 等级相关分析; 秩相关
一、案例介绍
某医师收集了224例肺癌患者的生存时间(time)和患者自评的卡氏评分(patkarno)。问患者自评的卡氏评分与其生存时间是否相关。部分数据见图1。本文案例可从“附件下载”处下载。
二、问题分析
本案例的分析目的是检验患者自评的卡氏评分与其生存时间是否相关,即探究自评卡氏评分与生存时间的相关性,两个变量均为定量变量,可以采用Pearson相关性分析或Spearman相关性分析。若使用Spearman相关性分析需要满足两个条件:
条件1:两个定量变量中至少有一个为非正态分布或总体分布未知或为等级资料。
条件2:两变量之间为单调关系。
三、软件操作及结果解读
(一) 适用条件判断
1. 条件1判断(正态性检验)
(1) 软件操作
①*使用Shapiro-Wilk检验考察两个变量的正态性*
swilk time patkarno
②*分别绘制两个变量的正态分位图*
qnorm time
qnorm patkarno
(2) 结果解读
图2、图3和图4给出了正态检验统计学推断的结果和Q-Q图。图2显示两个变量正态性检验的P值均<0.001,提示不满足正态性要求。在图3、图4的正态分位图上,两个变量的散点偏离对角线分布的较多,也提示两个变量不服从正态分布;综上,本案例满足条件1,即为数据不服从正态分布。
2. 条件2判断(单调性)
(1) 软件操作
*绘制散点图*
gr tw lfitci time patkarno || sc time patkarno,ms(O)
(2) 结果解读
图5给出了单调性的图示结果。由图5的散点图可知,生存时间随卡氏评分的增加而增加,呈单调关系,即本案例数据满足条件2。
(二) 统计描述及推断
1. 软件操作
*spearman相关分析*
spearman time patkarno
2. 结果解读
图6 spearman相关分析结果中给出了患者自评卡氏评分(patkarno)与生存时间(time)的Spearman相关系数和假设检验的P值。可知,患者的自评卡氏评分与生存时间有相关性,Spearman相关系数rs=0.2203,P<0.001,两变量间呈弱相关。
四、结论
本研究采用Spearman相关性分析对患者自评卡氏评分(patkarno)与生存时间(time)的相关性进行了检验。通过正态分位图和Shapiro-Wilk检验,提示数据为偏态分布,通过绘制散点图显示两变量之间呈单调关系。
Spearman相关性分析结果显示,患者的自评卡氏评分与生存时间之间为正相关(rs=0.2203,P<0.001),卡氏评分越高,患者的生存时间越长,但相关性程度较弱。
五、分析小技巧
- Spearman相关,又称秩相关、等级相关,是对两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围较广。对于服从Pearson相关的数据亦可计算Spearman相关系数,但统计效能更低。
- Spearman相关系数(rs)介于-1与1之间,rs >0为正相关,rs <0为负相关。rs的绝对值(|rs|)越大,变量间的相关性越强。
- 参考Pearson相关系数对rs进行等级划分:当0.9</r/<1,为高度相关;当0.7</r/<0.9,为强相关;0.4</r/<0.7,为中度相关;0.2</r/<0.4,为弱相关性;0</r/<0.2,为极弱相关或无相关性