关键词:SPSS; Cox等比例回归; Cox回归; 生存分析; 等比例风险
一、案例介绍
65例某癌症患者的随访资料见图1,其中time为生存时间,status为生存状态(0=失访,1=死亡),age为年龄,sex为性别(1=男,2=女)。本案例数据可从“附件下载”处下载。
二、K-M法绘制生存图
适用于变量为二分类和多分类的情况。分类变量的每一组Kaplan-Meier生存曲线间无交叉则提示满足PH假设。
以判断案例中性别风险比例情况为例。
(一) 软件操作
详见Kaplan-Meier生存分析(Kaplan-Meier Survival Analysis)——SPSS软件实现。
(二) 结果解读
图2为不同性别的生存分析曲线,可见两条曲线基本平行,无交叉。提示性别的生存率满足PH假设。
三、二次对数生存曲线图
适用于变量为二分类和多分类的情况。绘制某分类变量在不同状态下的二次对数生存曲线图(即横坐标是时间的对数,纵坐标是生存函数的对数的对数),如果生存曲线大致平行,表明PH假设成立,否则提示PH假设不成立。
以判断案例中性别风险比例情况为例。
(一) 软件操作
以“生存时间(time)”和“生存状态(status)”为因变量,以“性别”为自变量,构建单因素Cox回归分析,详细操作过程见Cox比例风险回归模型(Cox Proportional Hazard Regression Model)——SPSS软件实现。在“Cox回归:图”对话框(图3)中,勾选“负对数的对数”,将需要分析的变量“性别(sex)”选入“针对下列各项绘制单独的线条”。
(二) 结果解读
不同性别的二次对数生存曲线图见图4,可见两条曲线基本平行,无交叉。提示性别的生存率满足PH假设。
四、Schoenfeld残差法
主要适用于变量为计量资料的情况。通过观察偏残差(partial residual for age)和时间秩次(rank of time)的散点图走势是否呈现明显变化趋势,或者是否存在显著相关,判断其是否满足PH假设。
以判断案例中年龄风险比例情况为例。
(一) 软件操作
1. 生成偏残差
以“生存时间(time)”和“生存状态(status)”为因变量,以“性别(sex)”和“年龄(age)”为自变量,构建多因素Cox回归分析,详细操作过程见Cox比例风险回归模型(Cox Proportional Hazard Regression Model)——SPSS软件实现。在“Cox回归:保存”对话框(图5)中,勾选“偏残差”。将在数据库中生成2个新变量PR1_1和PR1_2,分别代表性别和年龄的偏残差(图6)。
2. 生成时间秩次
选择“转换”—“个案排秩”(图7);打开“个案排秩”对话框(图8),将时间变量time选入“变量”框中,点击右侧“类型排秩”;打开“个案排秩:类型”子对话框(图9),勾选“秩”;将在数据库中生成一个新变量“Rtime” (图10)。
3. 绘制残差散点图
绘制“简单散点图”,将Rtime选入X轴,PR1_2选入Y轴(图11),将生成年龄偏残差(partial residual for age)和时间秩次(rank of time)的散点图,即Schoenfeld残差图(图12)。从散点图中,可以观察到随着时间秩次的增大,曲线呈现先平稳然后下降的趋势。但有时候散点图可能无法准确的判断两者的变化趋势,此时可根据需要进一步绘制平滑曲线来帮助判断。
双击图形,出现“图表编辑器”操作界面(图13),然后单击鼠标右键,选中“添加总计拟合线”。
在图13中单击鼠标右键,选择“属性窗口”,打开“属性”对话框(图14),“拟合线”模块下选择Loess,绘制Loess平滑曲线(图15)。可见在图形中添加了一条平滑曲线,随着时间秩次的增大,曲线呈现先平稳然后下降的趋势,通过平滑曲线的变化趋势,可以大致判断协变量年龄的风险比例会随着时间的增加而降低,提示其不满足PH假设。还可以根据需要进一步对两者的相关性进行统计学检验。
4. 相关性分析
计算“PR1_2”与“Rtime”的相关系数(此处顺便计算“PR1_1”与“Rtime”的相关系数),详细操作见(Pearson相关性分析(Pearson Correlation Analysis)——SPSS软件实现)。
(二) 结果解读
Pearson相关性分析结果见图16,可见“Rank of time”与年龄的偏残差之间的Pearson相关系数为-0.611,关联有统计学意义(P<0.001),提示协变量年龄的风险比会随着时间的增加而降低,因此年龄不满足PH假设。同时可判断性别满足PH假设(Pearson相关系数为-0.067,P=0.626)。
五、交互项法
主要适用于变量为计量资料的情况。将每个协变量与对数生存时间的交互作用项(X ln(t))放入回归模型中,如果交互作用项无统计学意义,则满足PH假设。
(一) 软件操作
1. 构建交互项
详细操作参考SPSS变量管理。
选择“转换”—“计算变量”(图17)。
在“计算变量”对话框(图18)中的“目标变量”中输入需要生成的新变量名称,此处命名为“年龄交互项”。右侧“数字表达式”中录入“年龄交互项”的计算公式“LN(time)*age”。
在数据视图窗口可以看到新生成的变量“年龄交互项”(图19)。
2. 检验交互项的统计学意义
以“生存时间(time)”和“生存状态(status)”为因变量,以“性别(sex)”和“年龄交互项”为自变量,构建多因素Cox回归分析,详细操作过程见Cox比例风险回归模型(Cox Proportional Hazard Regression Model)——SPSS软件实现。
(二) 结果解读
“性别(sex)”和“年龄交互项”在Cox回归模型中的检验结果见图20,可知“年龄交互项”有统计学意义(P<0.001),提示不满足PH假设。
六、分析小技巧
当PH假设条件不成立时,可采用如下方法来解决:
- 将不成比例关系的变量作为分层变量,然后再用其余变量进行多因素Cox回归模型分析。
- 采用参数回归模型(如加速失效时间模型)替代Cox回归模型进行分析。
- 对于连续型协变量,可将每个协变量与对数生存时间的交互作用项(X ln(t))放入回归模型中。
- 采用时间依存Cox回归分析。