2×2 卡方检验(2×2 χ² Test)——SAS软件实现

2021年10月31日星期日发布于 14:10:10 浏览：5334

原创不易，转载请注明来源，感谢！

附件下载：

2×2卡方检验.zip 请勿重复点击，如无响应请耐心等待或稍后再试。

在前面文章中我们介绍了2×2 χ2检验(2×2 χ2 Test) 的假设检验理论，本篇文章将实例演示在SAS软件中实现2×2 χ²检验(2×2 χ² Test)的操作步骤。

关键词：SAS; 卡方检验; 理论频数; 实际频数; 四格表

一、案例介绍

某中医院欲比较某经典名方控制高血压的效果。将200例高血压患者随机分到试验组和对照组，随访三个月后患者的血压控制情况(分为有效和无效)。问该经典名方控制血压的效果如何？

χ²检验的数据录入可分为两种：第一种为频数资料，需要设置分组变量、观察变量和频数变量，该形式在进行χ²检验时较为常见，进行统计分析前需要进行数据加权。第二种为非频数资料，只有分组变量和观察变量两列，每一行为一个患者的数据，该形式是在SAS软件中进行各种统计分析最常用的资料形式，进行χ²检验前不需要进行数据加权。

本案例的数据采用了第一种录入方式。创建分组变量“Group”，赋值为“1”和“2”分别代表试验组和对照组。创建观察变量“Effect”，赋值为“1”和“2”分别代表血压控制有效和无效。创建频数变量“Frequency”，记录各组各种控制情况的患者数。数据见图1。本文案例可从“附件下载”处下载。

二、问题分析

本案例的分析目的是探究某经典名方控制血压的效果，即比较试验组与对照组血压控制率是否有差异，针对这种情况可以制作四格表，并进行2×2 χ²检验。但需要满足3个条件：

条件1：分组变量与观察变量均为二分类变量。本案例的分组变量(Group)和观察变量(Effect)均为二分类变量，该条件满足。

条件2：观察变量相互独立。本研究中各研究对象的观察变量都是独立的，不存在互相干扰的情况，该条件满足。

条件3：总例数≥40，且所有期望频数(理论频数)≥5。该条件需要通过软件分析后判断。

三、软件操作及结果解读

(一) 适用条件判断

对于本案例数据，条件1和条件2均满足。但需要通过总例数和期望频数来选择具体的分析方法(Pearson χ²检验、连续校正χ²检验或Fisher确切概率法)。这一判断过程通过统计描述来完成，详见下文。

(二) 统计描述及推断

1. 软件操作

本案例为频数资料，需要先手动输入数据。

data mydata;
input group effect frequency@@;
cards;
1 1 99 1 2 5 2 1 75 2 2 21;
proc print noobs;
run;

结果如图1所示。

其次进行卡方检验，通过weight对frequency进行加权处理。

proc freq data=mydata;
weight frequency;
tables group*effect/chisq expected;
run;

2. 结果解读

(1) 统计描述

图2为“Group-Effect 表(组别*效果交叉表)”，给出了试验组和对照组的观察值、期望频数及组内占比。由结果可知，试验组和对照组的血压控制率分别为95.19%和78.13%。总例数为200例，期望频数均>5。

(2) 统计学推断

解读χ²检验结果时，遵循以下原则：当总例数≥40，且所有期望频数(理论频数)≥5时，可使用Pearson χ²检验。当总例数≥40，有1个期望频数≥1且<5，可使用连续校正χ²检验。当总例数＜40或有1个期望频数＜1，需要使用Fisher确切概率法。无论总例数的大小及期望频数分布情况如何，Fisher确切概率法均可使用。在计算机能够满足运行负荷的情况下，推荐使用Fisher确切概率法。如果使用Pearson χ²检验或连续校正χ²检验得出的P值比较接近检验水准，建议采用Fisher确切概率法。

图3为本案例χ²检验结果，其中列出了多种检验结果。SAS默认在“当超过20%的表单元格的预期频率小于5时”给出一条警告信息。此时表格下方是没有提示的，因为没有单元格的期望频数少于5，最小期望计数为12.48(见图2)。同时因为本案例样本数大于40，所以检验结果可以采用第一行的卡方检验统计量，为Pearson χ²=12.8571，P值为0.0003<0.001，所以Pearson χ²检验结果表明两组高血压患者的血压控制率差异有统计学意义。最后“Fisher确切概率法”结果进一步验证了Pearson χ²检验的结论。

四、结论

本研究采用2×2 χ²检验(独立样本χ²检验)比较两组高血压患者血压控制率有无差别。数据满足2×2 χ²检验的条件，总例数为200例，期望值均>5，采用Pearson χ²检验结果。结果显示，试验组和对照组的血压控制率分别为95.19%和78.13%，差异有统计学意义(χ²=12.8571，P<0.001)，试验组的血压控制率高于对照组。

我要纠错

End

2×2 Fisher确切概率法(2×2 Fisher’s Exact Test)——SAS软件实现