关键词:SPSS; 比值比; 数据加权; OR值
一、案例介绍
某研究员欲探究脑卒中(Stroke)的危险因素,在某地区抽样调查了345名35岁以上居民脑卒中的患病情况,现将所有调查对象按照年龄是否≥60岁分为中年组(35-59岁)和老年组(≥60岁)。问老年人的脑卒中患病风险是中年人的多少倍?
创建分组变量“Age”,测量尺度设为“名义”,赋值为“1”和“2”分别代表老年组(≥60岁)和中年组(35-59岁)。创建观察变量“Stroke”,测量尺度设为“名义”,赋值为“1”和“0”分别代表是否患脑卒中。创建频数变量“Frequency”,测量尺度设为“标度”,记录各组脑卒中患病人数。对数据的变量和水平进行标签赋值后部分数据见图1。本文案例可从“附件下载”处下载。
二、问题分析
本案例的分析目的是计算老年人的脑卒中患病风险是中年人的多少倍,也就是计算老年人与中年人脑卒中患病的比值比(Odds Ratio,OR)。
本案例以独立样本χ2检验为例计算OR值,需要满足2个条件:
条件1:自变量和因变量均为二分类变量,本案例中的年龄分组和脑卒中患病情况均为二分类变量,满足该条件;
条件2:独立性,即观测值之间互不干扰,本案例的观测间相互独立,满足该条件。
三、软件操作及结果解读
(一) 适用条件判断
本案例数据满足上述条件。
(二) 统计描述及推断
1. 软件操作
(1) 数据加权
本案例为频数资料,需要先进行加权处理。
①选择“数据”—“个案加权”(图2),出现“个案加权”对话框。
②在“个案加权”对话框中选择“个案加权依据”,将左侧变量“Frequency”选入右侧“频数变量”框中,点击“确定”,则完成数据加权(图3)。
(2) 计算比值比
完成数据加权后可以计算比值比。
①选择“分析”—“描述统计”—“交叉表”(图4)。
②出现“交叉表”对话框,将分组变量“Age”放入右侧“行”变量框中,将结果变量“Stroke”放入右侧“列”变量框中(图5),“行”和“列”中的变量可以互换位置,不影响检验结果。
③点击“交叉表”对话框右侧“统计”,在“交叉表:统计”对话框中勾选“卡方”和“风险”,然后点击“继续”回到“交叉表”对话框(图6)。
④点击“交叉表”对话框右侧“单元格”,在“交叉表:单元格显示”对话框中勾选“实测”、“期望”、“列”,其他保持默认不变,如图7所示。点击“继续”后回到“交叉表”对话框,点击“确定”,则得到卡方检验结果。
2. 结果解读
(1) 统计描述
图8为“年龄*脑卒中交叉表”,给出了两个年龄组的观察值、期望频数及组内占比。由结果可知,患脑卒中的人群中老年组占70.7%,未患脑卒中的人群中老年组占41.5%。
(2) 统计学推断
解读χ2检验结果时,遵循以下原则:
①当总例数≥40,且所有期望频数(理论频数)≥5时,可使用Pearson χ2检验。
②当总例数≥40,有1个期望频数≥1且<5,可使用连续校正χ2检验。
③当总例数<40或有1个期望频数<1,需要使用Fisher确切概率法。
④无论总例数的大小及期望频数分布情况如何,Fisher确切概率法均可使用。在计算机能够满足运行负荷的情况下,推荐使用Fisher确切概率法。
⑤如果使用Pearson χ2检验或连续校正χ2检验得出的P值比较接近检验水准,建议采用Fisher确切概率法。
图9为卡方检验结果。表格下方的注脚a提示:没有单元格的期望频数少于5,最小期望计数为70.99。同时本案例样本数大于40,所以检验结果可采用第一行的Pearson χ2检验。“Value(统计量)”为χ2=29.471,P<0.001,表明患脑卒中和未患脑卒中的两组人群中年龄构成的差异有统计学意义。
图10为“风险评估”结果。“Odds Ratio for Age(按年龄分组的比值比)”为3.403[OR=(111×110)/(78×46)],OR的95% CI为2.170~5.336。本案例中OR值可信区间不包括1,且下限>1,可以认为老年组脑卒中的患病风险是中年组的3.403 (95%CI: 2.170~5.336)倍。
四、结论
本研究采用2×2 χ2检验(独立样本χ2检验)计算比值比。结果显示,患脑卒中的人群中老年组占70.7%,未患脑卒中的人群中老年组占41.5%;老年人患脑卒中的风险是中年人的3.403 (95%CI: 2.170~5.336)倍,即高龄是脑卒中的危险因素。
五、知识小贴士
- 比值比,又称比数比、优势比,是病例组与对照组暴露比值之比(比值指某事物发生的可能性与不发生的可能性之比)。
- OR>1说明暴露与结局呈“正”关联,暴露是结局事件的促进因素。
- OR<1说明暴露与结局呈“负”关联,暴露是结局事件的抑制因素。
六、分析小技巧
- OR值的计算可以通过两种方法完成:一是采用独立样本χ2检验(Independent Samples χ2 Test)。第二种是采用单因素二项logistic回归(Binary logistic regression)。
- 两种方法均可以得到OR值及其95%置信区间。OR值可信区间若包括1,则表明无统计学意义,其与P<0.05等价。
- 独立样本χ2检验中还可计算队列研究的相对危险度(RR),在“Statistics (统计分析)”的“[Comparative Measures (2×2 only)](效应比较)”中勾选“Relative risk (相对风险)”即可。