χ²分布及χ²检验的基本思想——理论介绍

发布于 2021年10月20日 星期三 15:16:05 浏览:11800
原创不易,转载请注明来源,感谢!

关键词:卡方分布; 卡方检验; 理论频数; 实际频数

一、χ²分布

(一) χ²分布的定义

n个相互独立的随机变量ξ₁ξ₂,...,ξn均服从标准正态分布,则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution),用χ²表示,英文chi,读音/kaɪ/。可表示为:

\(\chi^2=\frac{(n-1)s^2}{\sigma^2}\)

其中,S2为样本方差,σ2为总体方差。

(二) χ²分布的特征

χ²分布是一种只由自由度ν一个参数决定的连续型分布。由其密度函数曲线(图1)可知:

1. χ²分布为一簇单峰正态分布曲线,当自由度ν≤2时,曲线呈L型;随着ν的增加,曲线逐渐趋于对称;当自由度ν→∞时,分布趋于正态分布。

2. χ²分布具有可加性:如果两个独立的随机变量ξ₁ξ₂分别服从自由度ν1ν2的χ²分布,即

\(\xi_{1} \sim \chi_{v_{1}}^{2}\),\(\xi_{1}\sim\chi_{v_{2}}^{2}\)那么它们的和(ξ₁+ ξ₂)服从自由度ν1+ν2的χ²分布,即\(\left(\xi_{1}+\xi_{2}\right) \sim \chi_{v_{1}+v_{2}}^{2}\)。

3. χ²界值:当自由度ν确定后,χ²分布曲线下右侧尾部的面积为α时,横轴上相应的χ²值记作

\(\chi_{a, v}^{2}\),即χ²分布的界值。由(χ²界值表)可知,χ²值愈大,P值愈小;反之,χ²值愈小,P值愈大。χ²检验时,先计算检验统计量χ²值,然后按自由度ν查(χ²界值表),确定P值。

图1

(三) χ²分布的作用

可用χ²分布近似描述具有某种属性的实际频数Ai与理论频数Ti之间的抽样误差,即:

\( \chi^2=\sum\frac{(A_i-T_i)^2}{T_i} \)

如果样本含量和理论频数均较大(如n≥40,Ti≥5),或自由度大于1时,近似程度较好。因此,χ²分布除可用于方差的抽样分布研究外,还可用于样本分布与理论分布的拟合优度检验、率或构成比的比较等。

二、χ²检验的基本思想

现以两样本率比较的χ²检验为例,介绍χ²检验的基本思想。

(一) 案例介绍

某中医院欲比较某经典名方控制高血压的效果。将200例高血压患者随机分到试验组(Trial group)和对照组(Control group),随访三个月后患者的血压控制情况[分为有效(Effective)和无效(Noneffective)]。问该经典名方控制血压的效果如何?数据见图2。

图2

本例只有(abcd)4个数是基本数据,其余数据都是由这4个基本数据推算所得,故称为四格表(fourfold table)资料。整理出检验所需数据见图2。其中组别一般作为行变量,疗效一般作为列变量。通过数据可计算出试验组的血压控制率为56.89%,对照组为19.23%,但这两者所代表的总体率间确实有差异,还是由于抽样误差所致,需要通过假设检验来回答。当两样本含量比较大或两样本率近似服从正态分布时,则既可用u检验(Z检验)也可用χ²检验来推断两总体率是否有差别,且两种检验方法是等价的。对同一份资料有u2=χ²

(二) 建立检验假设,确定检验水准

该案例的无效假设为H0π1=π2,即试验组和对照组的总体血压控制率相等。若该假设检验成立,两种方法的疗效应当相同,即200名患者中有104名有效,合计有效率为52%,合计无效率为48%。

(三) 计算理论频数

在无效假设成立的条件下,可以推算每个格子的理论频数(theoretical frequency),用T表示。如,H0π1=π2成立,那么理论上,试验组的174例高血压患者中血压控制有效的理论人数T11应为174×52%=90.48人(四格表第一行、第一列,即第一个格子),血压控制无效的理论人数T12为174×48%=83.52人(四格表第一行、第二列,即第二个格子);同理,对照组的26例高血压患者中血压控制有效的理论人数T21应为26×52%=13.52人(四格表第二行、第一列,即第三个格子),血压控制无效的理论人数T22为26×48%=12.48人(四格表第二行、第二列,即第四个格子)。由此可总结出列联表中第R行(row)第C列(column)格子的理论频数TRC可表达为:

\( T_{R C}=\frac{n_{R} n_{C}}{n_{1}} \)

式中nR为相应行的合计, nc 为相应列的合计,n为总例数。

(四) 度量实际频数与理论频数之间的差异

使用Pearson χ²统计量可度量实际频数A与理论频数T之间的差异。

\(\chi^2=\sum\frac{(A-T)^2}{T}\),ν=(行数-1)(列数-1)

(五) 作出统计推断

由卡方计算公式可知,若H0π1=π2成立,实际频数A与理论频数T之间的差异仅由抽样误差所致,不应太大,χ²会较小;反之,若检验假设H0不成立,实际频数与理论频数的差值会较大,则χ²也会较大。此外,χ²的大小还取决于\(\frac{(A-T)^2}{T}\) 个数的多少(严格地说是自由度ν的大小)。由于各 \(\frac{(A-T)^2}{T}\)皆是正值,故自由度ν愈大,χ²值也会愈大;所以只有考虑了自由度ν的影响,χ²值才能正确地反映实际频数A和理论频数T的吻合程度。

H0成立,χ²值离0太远的概率比较小。设检验水准为α,在χ²分布中,右侧尾部面积为α时的临界值记为\(\chi_{a, v}^{2}\) ,可通过(χ²界值表)获得,即\(P\left(\chi^{2}\geq\chi_{a, v}^{2}\right)=\alpha\)。根据假设检验的基本思想,当在单次抽样中获得的\(\chi^{2}\geq\chi_{a, v}^{2}\)时,Pa,则认为发生了H0成立条件下的小概率事件,继而做出拒绝H0、接受H1的统计推断;反之 \(\chi^{2}<\chi_{a, v}^{2}\) 时,P>a,此时不拒绝H0

需要注意的是,χ²分布本身是一种连续型随机变量的概率分布,而基于频数计算的χ²值是离散的,不可能取[0,+∞)的任意值,因此χ²只是近似服从χ²分布,只有当样本例数或理论频数足够大时,这种近似才较好,进行χ²检验才是有效的。

End
文章目录 沉浸式阅读