四格表资料的Fisher确切概率法(2×2 Fisher's Exact Test)——理论介绍

发布于 2021年10月22日 星期五 23:25:54 浏览:19089
原创不易,转载请注明来源,感谢!

四格表资料的Fisher确切概率法是由R.A.Fisher于1934年提出的,理论依据是超几何分布(hypergeometric distribution),可直接计算实际频数出现的理论概率。虽然不属于χ²检验的范畴,但在实际应用中常用它作为四格表资料假设检验的补充本篇文章将举例介绍四格表资料的Fisher确切概率法的相关理论。

关键词:卡方检验; Fisher确切概率法; Fisher精确检验; 费希尔确切概率法; 费希尔精确检验

一、适用条件

条件1:分组变量和观察变量均为二分类变量。

条件2:观测值相互独立。

二、基本思想

图1

在四格表周边合计数固定不变的情况下,计算图1内4个实际频数变动时的各种组合之概率Pi;再按检验假设用单侧或双侧的累积概率P,依据所取检验水准α作出推断。

(一) 各组合概率Pi的计算

在四格表周边合计数不变的条件下,当四格表内实际频数a、b、c、d有一个取值确定,则整个频数的组合即确定。因此图1内4个实际频数a、b、c、d变动的组合数共有“周边合计中最小数+1”个。如C1=3,则a的可能取值为0,1,2,3。第i种组合的概率Pi公式如下,服从超几何分布:

\( P_i=\frac{(a+b)!(c+d)!(a+c)!(b+d)!}{a!b!c!d!n!} \)

n=abcd

!为阶乘符号,n为总例数,i为各种组合的序号。各种组合的概率Pi服从超几何分布,且 \( \Sigma_{\mathrm{P}_{\mathrm{i}}}=1 \) 。

(二) 累计概率Pi的计算

Pi (i=1,2,…)对应于a从小到大的概率,记现有样本四格表的概率为P*

1. 单侧检验:现有样本四格表及其以左的所有四格表组合的累计概率为左侧概率,记为PL;现有样本四格表及其以右的所有四格表组合的累计概率为右侧概率,记为 PR。若备择假设 H1为 π1>π2,则 P单侧=PR;若H1为 π1π2,则 P单侧=PL

2. 双侧检验:计算满足 PiP*条件下的各种组合之四格表的累计概率。若遇到 a + b = c+ d 或 a + c = b + d 时(即行合计相等或列合计相等),四格表内各种组合的序列呈对称分布,此时可只计算满足条件的单侧累计概率,然后乘以2即得双侧累计概率。

三、案例数据

某医师为研究术前使用抗菌药A预防术后感染的效果,将34例行人工全膝关节置换术的患者随机分为试验组(Trial group)和对照组(Control group),收集患者术后感染的情况[分为阳性(Positive)和阴性(Negative),数据见图2。问两组患者术后感染率有无差别?

图2

四、假设检验

本例n<40,且有两个格子的理论频数为3.5<5,宜用四格表资料的Fisher确切概率法,其假设检验的步骤如下:

(一) 建立检验假设,确定检验水准

H0π1=π2,即两组患者术后感染率相同

H1π1π2,即两组患者术后感染率不相同

α=0.05

(二) 计算概率

在周边合计不变的条件下,只需依次增减样本四格表第1个格子a的数据,即得到8个四格表,并按a由小到大排列,结果见图3。

1. 计算现有样本四格表的概率P*及各组合下四格表的概率Pi

图3

由图3可知各种组合以i=4和i=5的组合为中心呈对称分布。本例P*=0.1564364445。

2.计算满足 PiP*的所有四格表的累计概率

本例P1P2P3P6P7P8满足条件,累计概率为:

P=P1P2P3P6P7P8=0.39832139

(三) 确定P值,作出推断结论

P>0.05,α=0.05水准,不拒绝H0,尚不能认为两组患者的术后感染率不同。

End
文章目录 沉浸式阅读