关键词:SPSS; 卡方检验; 理论频数; 实际频数; 四格表
一、案例介绍
某中医院欲比较某经典名方控制高血压的效果。将200例高血压患者随机分到试验组和对照组,随访三个月后患者的血压控制情况(分为有效和无效)。问该经典名方控制血压的效果如何?
创建分组变量“Group”,测量尺度设为“名义”,赋值为“1”和“2”分别代表试验组和对照组。创建观察变量“Effect”,测量尺度设为“名义”,赋值为“1”和“0”分别代表血压控制有效和无效。创建频数变量“Frequency”,测量尺度设为“标度”,记录各组各种控制情况的患者数。对数据的变量和水平进行标签赋值后部分数据见图1。本文案例可从“附件下载”处下载。
二、问题分析
本案例的分析目的是探究某经典名方控制血压的效果,即比较试验组与对照组血压控制率是否有差异,针对这种情况可以制作四格表,并进行2×2 χ2检验。但需要满足3个条件:
条件1:分组变量与观察变量均为二分类变量。本案例的分组变量(Group)和观察变量(Effect)均为二分类变量,该条件满足。
条件2:观察变量相互独立。本研究中各研究对象的观察变量都是独立的,不存在互相干扰的情况,该条件满足。
条件3:总例数≥40,且所有期望频数(理论频数)≥5。该条件需要通过软件分析后判断。
三、软件操作及结果解读
(一) 适用条件判断
对于本案例数据,条件1和条件2均满足。但需要通过总例数和期望频数来选择具体的分析方法(Pearson χ²检验、连续校正χ²检验或Fisher确切概率法)。这一判断过程通过统计描述来完成,详见下文。
(二) 统计描述及推断
1. 软件操作
本案例为频数资料,需要先进行加权处理。
①选择“数据”—“个案加权”(图2),出现“个案加权”对话框。
②在“加权个案”对话框中选择“个案加权依据”,将左侧变量“Frequency”选入右侧“频数变量”框中,点击“确定”,则完成数据加权(图3)。
加权个案后进行χ2检验。
③选择“分析”—“描述统计”—“交叉表”(图4)。
④出现“交叉表”对话框,将分组变量“Group”放入右侧“行”下方的变量框中,将结果变量“Effect”放入右侧“列”下方的变量框中(图5),“行”和“列”中的变量可以互换位置,不影响检验结果。
⑤点击“交叉表”对话框右侧“统计”,在“交叉表:统计”对话框中勾选“卡方”,然后点击“继续”回到“交叉表”对话框(图6)。
⑥点击“交叉表”对话框右侧“单元格”,在“交叉表:单元显示”对话框中勾选“观测”、“期望”、“行”,其他保持默认不变,如图7所示。点击“继续”后回到“交叉表”对话框,点击“确定”,则得到卡方检验结果。
2. 结果解读
(1) 统计描述
图8为“Group*Effect 交叉表”,给出了试验组和对照组的观察值、期望频数及组内占比。由结果可知,试验组和对照组的血压控制率分别为95.2%和78.1%。总例数为200例,期望频数均>5。
(2) 统计学推断
图9为本案例χ²检验结果,其中列出了多种检验结果。表格下方的注脚a提示:没有单元格的期望频数少于5,最小期望计数为12.48。同时因为本案例样本数大于40,所以检验结果可以采用第一行的Pearson χ²检验。“Value(统计量)”为χ2=12.857,“Exact Sig.(2-sided)(双侧精确P值)”为<0.001,所以Pearsonχ²检验结果表明两组高血压患者的血压控制率的差异有统计学意义。第四行“费希尔精确检验(Fisher确切概率法)”结果进一步验证了Pearson χ²检验的结论。
四、结论
本研究采用2×2 χ²检验(独立样本χ²检验)比较两组高血压患者血压控制率有无差别。数据满足2×2 χ²检验的条件,总例数为200例,期望值均>5,采用Pearson χ²检验结果。结果显示,试验组和对照组的血压控制率分别为95.2%和78.1%,差异有统计学意义(χ2=12.857,P<0.001),试验组的血压控制率高于对照组。
五、知识小贴士
- 当总例数≥40,且所有期望频数(理论频数)≥5时,可使用Pearson χ²检验。当总例数≥40,有1个期望频数≥1且<5,可使用连续校正χ²检验。当总例数<40或有1个期望频数<1,需要使用Fisher确切概率法。
- 无论总例数的大小及期望频数分布情况如何,Fisher确切概率法均可使用。在计算机能够满足运行负荷的情况下,推荐使用确切概率法。如果使用Pearson χ²检验或连续校正χ²检验得出的P值比较接近检验水准,建议采用Fisher确切概率法。
- 关于χ2检验的更多内容详见χ²检验的注意事项——使用技巧。
六、分析小技巧
χ²检验的数据录入可分为两种:
- 第一种为频数资料,需要设置分组变量、观察变量和频数变量,该形式在进行χ²检验时较为常见,进行统计分析前需要进行数据加权。本案例的数据即为该种录入方式。
- 第二种为非频数资料,只有分组变量和观察变量两列,每一行为一个患者的数据,该形式是在SPSS软件中进行各种统计分析最常用的资料形式,进行χ²检验前不需要进行数据加权。