关键词:SPSS;Cox等比例回归;Cox回归;生存分析;等比例风险;含时间依存协变量;时依协变量
一、案例介绍
某肿瘤研究所收集了79例某癌患者的生存数据:包括生存时间(time,月)、生存状态(status,0=“删失”,1=“死亡”)、手术时的年龄(age,岁)、性别(sex,0=“男”,1=“女”)和是否手术治疗(Ope,0=无,1=有),部分数据见图1。现欲探究患者的年龄、性别、是否手术治疗与生存结局的关系。案例可从“附件下载”处下载。
二、问题分析
本案例的目的是探究癌症患者的年龄、性别和是否手术与生存结局的关系,可以采用Cox比例风险回归模型进行分析,但需要满足5个条件:
条件1:因变量是含有时间信息的二分类变量。本案例中因变量是包含生存时间的二分类资料,time是生存时间(月);status是生存结局。本案例数据满足该条件。
条件2:各观测值之间相互独立,无互相干扰。由数据和研究设计可知,该条件满足。
条件3:一般要求样本量为自变量个数的10~20倍(EPV原则)。本文3个自变量,总例数为79例,该条件满足。
条件4:自变量之间无严重多重共线性。该条件需要软件分析来判断。
条件5:等比例风险(Proportionalhazards,PH)假设,该条件需要软件分析来判断。
三、软件操作及结果解读
(一)适用条件判断
1. 条件4判断(共线性检测)
(1) 软件操作
点击“分析”→“回归”→“线性”(图2)。
将变量“status”选入“因变量”,变量“age”、”sex”和“Ope”选入“自变量”(图3)。
点击图3右侧“统计”,在“统计”子对话框中勾选“共线性诊断”(图4),点击“继续”后回到图3,点击“确定”。
(2) 结果解读
检验结果见图5。如果“容差(应为Tolerance,容忍度)”小于0.1或“VIF(方差膨胀因子)”大于10,则提示有严重共线性存在。本例中各变量的容忍度均远大于0.1,VIF均远小于10,提示自变量之间不存在严重多重共线性。如果数据存在严重多重共线性,需用复杂的方法进行处理,其中最简单的是剔除引起共线性的因素之一,剔除哪一个因素可以基于理论依据。本案例满足条件4。
2. 条件5判断(等比例风险判定)
PH假定指自变量对生存率[风险比值h(t)/h0(t)]的影响不会随时间的变化而变化。若不满足PH假定,则需要改用含时间依存协变量的Cox比例模型分析数据。
(1) 软件操作
PH判定方法详见“等比例风险(Porportional hazards)判断——SPSS软件实现”。本案例采用Schoenfeld残差法判断3个自变量的PH情况。
(2) 结果解读
3个自变量偏残差和时间秩次(rank of time)的Pearson相关性分析结果见图6,可见均P>0.05,表示均满足PH假设。
(二) Cox回归分析
本文可以先进行单因素Cox回归分析,再进行多因素Cox回归分析。由于自变量较少,此处直接演示“进入法”的多因素Cox回归分析步骤。
1. 软件操作
选择“分析”—“生存分析”—“Cox回归”(图7)。
打开“Cox回归”对话框(图8),将time选入“时间”,将status选入“状态”,点击“定义事件”,打开“Cox回归:为状态变量定义事件”子对话框(图9)中,“单值”填入1,点击“继续”后回到图8;再将age、sex、Ope选入“协变量”,“方法”选择“输入”,即强制所有自变量进入模型。
点击图8右侧“分类”,打开“Cox回归:定义分类协变量”子对话框(图10),设置自变量的参照水平,此处设置sex的参照变量为“男”(即选择第一个水平),设置Ope的参照水平为“有外科手术”(即选择最后一个水平)。
点击图8右侧“选项”,打开“Cox回归:选项”子对话框(图11),勾选“Exp(B)的置信区间”,点击“继续”后回到图8,点击“确定”。
2. 结果解读
“个案处理摘要”结果见图12,79例患者最后出现结局终点事件(死亡)74例,5例删失。“分类变量编码”展示了分类变量的编码情况。
模型系数的Omnibus检验(Omnibus Tests of Model Coefficients)是模型系数的综合检验,是对模型中所有参数是否均为0的检验结果。若P<0.05,表示本次拟合的模型中至少有一个变量的HR值有统计学意义,即模型总体有意义。 本案例结果见图13。总体P=0.054>0.05,提示模型总体无统计学意义。不过如果分析目的不是构建预测模型,仅是校正混杂因素,此处的Omnibus检验不是很重要。当然读者也可使用多种自变量进入模型的方法构建多个模型,详细探讨每个自变量的HR估计值及统计学检验结果(此处不赘述)。
多因素Cox回归分析变量效应量估计的结果见图14。由于此时自变量进入模型采用的强制法,所以3个自变量均在模型中。可知手术时的年龄和性别在模型中均无统计学意义(P>0.05),有无外科手术在模型中有统计学意义(P=0.008)。未进行手术治疗的患者死亡风险是手术治疗者的2.081倍(HR=2.081,95%CI 1.207~3.589)。
若本案例自变量进入模型选择“向后最大似然法(向后:LR)”,其模型系数的Omnibus检验和变量的效应量估计见图15。可知经过3个步骤,最终的模型Omnibus检验有统计学意义(P=0.014)。最终只有“有无外科手术”进入模型,HR=1.922,95%CI 1.132~3.264。
四、结论
本研究采用Cox比例风险模型探究癌症患者年龄、性别、是否手术治疗与生存结局的关系,数据样本量满足要求,自变量之间无严重多重共线性,所有自变量满足PH假设。
采用自变量“强制法”进入模型的多因素Cox回归分析发现,手术时的年龄和性别在模型中均无统计学意义(P>0.05),有无外科手术在模型中有统计学意义(P=0.008)。未进行手术治疗的患者死亡风险是手术治疗者的2.081倍(HR=2.081,95%CI: 1.207~3.589)。