基于汇总数据的Logit对数线性模型(Logit Log-linear Model)——SPSS软件实现

发布于 2022年10月4日 星期二 17:11:35 浏览:1306
原创不易,转载请注明来源,感谢!
附件下载:
logit对数线性模型(加权数据).zip 请勿重复点击,如无响应请耐心等待或稍后再试。

在前面文章中介绍了一般对数线性模型(General Log-linear Model)在SPSS软件中的操作,本文将实例演示在SPSS软件中利用加权数据实现Logit对数线性模型(Logit Log-linear Model)的操作步骤。

关键词:SPSS; Logit对数线性模型; 因果关系明确的对数线性模型

一般线性模型对所有变量一视同仁,不区分因变量和自变量。但有时,研究者对研究变量间的因果关系已经了解,研究目的是分析自变量与因变量之间的关系。此时用一般对数线性模型就无法利用该信息。在这种情况下,就可以用logit过程提供的logit模型来进行分析。该模型明确分出因变量和自变量,分析因变量和自变量之间的因果关系。模型中将自动引入自变量与因变量的交互作用。在拟合结果上,logit模型实际上与熟悉的logistic回归模型等价。

一、案例介绍

此处仍然采用二分类logistic回归分析(Binomial Logistic Regression Analysis)——SPSS软件实现一文中的案例。探讨经皮内镜下腰椎间盘摘除术治疗腰椎间盘突出疗效不佳的主要影响因素,纳入146例治疗效果“不佳”(记录为1)的患者,278例治疗效果“良好”(记录为0)的患者,并统计年龄(0=60岁以下,1=60岁及以上)、突出部位(1=单侧,2=中央,3=极外侧)患者的例数。在一般对数线性模型中,探讨了“年龄”和“突出部位”与治疗效果不佳之间是否有关;本文探讨“年龄”和“突出部位”对治疗效果的影响。相关变量整理为加权数据,数据见图1。本案例数据可从“附件下载”处下载。

图1

二、案例分析

本案例的分析目的不再是探讨“年龄”和“突出部位”与治疗效果不佳之间是否有关,而是探讨“年龄”和“突出部位”对治疗效果的影响。对于这种已具有一定因果关系背景的情况,可采用Logit对数线性模型进行数据分析。

三、Logit对数线性模型

(一) 数据加权

先对数据进行加权。选择“数据”—“个案加权”(图2)。

图2

在“个案加权”页面,将“频数”选入“个案加权依据”下的“频率变量”,单击“确定”。

图3

(二) 软件操作

选择“分析”—“对数线性”—“分对数”(图4)。

图4

“因变量”中选入“预后”,“因子”中选入“年龄”和“突出部位”(图5)。

图5

点击“模型”,点击“构建项”,将“年龄”和“突出部位”选入右侧“模型中的项”(图6)。注意,logit对数线性模型中将自动引入自变量与因变量的交互作用。

图6

点击“选项”,勾选“频率”“残差”“估算值”。将“Delta”中的“0.5”更改为“0”(图7)。

模型在计算时会首先对所有单元格中频数均加上“Delta”值,以避免某些单元格中频数为0时可能引起的计算问题。这样做不会影响统计检验的结果,但是当数据量较少时会略微影响参数的估计值。因此,数据较为简单时,若不存在空单元格,则建议将“Delta”设定为0;若存在空单元格,则将“Delta”设定为0.5。

图7

(三) 结果解读

图8中“数据信息”列出了案例数和变量的水平数。“收敛信息”呈现了迭代收敛信息。

图8

“拟合优度检验”结果(图9)显示,模型中分析的作用包括:“常量+预后+预后*年龄+预后*突出部位”,可见与饱和模型之间还相差“预后*年龄*突出部位”交互项。但目前模型与饱和模型之间差异无统计学意义,因此目前模型是适当的。如果此处差异有统计学意义,需要在“模型”设置中加入“年龄*突出部位”交互项,分析“预后*年龄*突出部位”的效应。

图9

“离散分析”和“相关性测量”结果(图10)都用于给出模型解释度,类似于回归模型中的决定系数,具体以熵和集中度进行计算。如数据中的总熵为273.002,其中被模型解释掉了21.540,因此通过熵测得的模型解释度为21.540/273.002 = 0.079。但由于此处拟合的是分类变量的模型,解释度的意义并不大(如Logistic回归模型中的伪决定系数)。

图10

“单元格计数和残差”表格(图11)中所列的为各单元格的实际频数、理论频数及其占总样本例数的比例等。

图11

“参数估算值”结果(图12)对自变量的任意组合分别估计了常数项,而不同于一般对数线性模型中只给出了变量部分水平的结果。表格中所有参数和一般对数线性模型分析结果完全一致。可知“预后”和“年龄”的交互作用具有统计学意义(P<0.001),OR年龄=Exp(1.278)= 3.589454,即常数e的1.278次方。表明“60岁以下”者预后良好的概率约为“60岁及以上”者的3.589454倍,即“60岁及以上”者预后不佳的风险约为“60岁以下”者的3.589454倍。同理,可知“单侧”患者预后良好的概率是“极外侧”患者的2.565107倍(P=0.018),“中央”患者预后良好的概率是“极外侧”患者的1.130884倍(P=0.760)。

图12

四、结论

通过Logit对数线性模型分析可认为,“60岁以下”者预后良好的概率约为“60岁及以上”者的3.589454倍,“单侧”患者预后良好的概率是“极外侧”患者的2.565107倍(P=0.018),“中央”患者预后良好的概率是“极外侧”患者的1.130884倍(P=0.760)。

End
文章目录 沉浸式阅读