χ²分布及χ²检验的基本思想——理论介绍

2021年10月20日星期三发布于 15:16:05 浏览：21494

原创不易，转载请注明来源，感谢！

关键词：卡方分布; 卡方检验; 理论频数; 实际频数

一、χ²分布

(一) χ²分布的定义

若n个相互独立的随机变量ξ₁，ξ₂，...，ξ_n均服从标准正态分布，则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量，其分布规律称为卡方分布(chi-square distribution)，用χ²表示，英文chi，读音/kaɪ/。可表示为：

\(\chi^2=\frac{(n-1)s^2}{\sigma^2}\)

其中，S²为样本方差，σ²为总体方差。

(二) χ²分布的特征

χ²分布是一种只由自由度ν一个参数决定的连续型分布。由其密度函数曲线(图1)可知：

1. χ²分布为一簇单峰正态分布曲线，当自由度ν≤2时，曲线呈L型；随着ν的增加，曲线逐渐趋于对称；当自由度ν→∞时，分布趋于正态分布。

2. χ²分布具有可加性：如果两个独立的随机变量ξ₁和ξ₂分别服从自由度ν_₁和ν_₂的χ²分布，即

\(\xi_{1} \sim \chi_{v_{1}}^{2}\)，\(\xi_{2}\sim\chi_{v_{2}}^{2}\)那么它们的和(ξ₁+ ξ₂)服从自由度ν_₁+ν_₂的χ²分布，即\(\left(\xi_{1}+\xi_{2}\right) \sim \chi_{v_{1}+v_{2}}^{2}\)。

3. χ²界值：当自由度ν确定后，χ²分布曲线下右侧尾部的面积为α时，横轴上相应的χ²值记作

\(\chi_{a, v}^{2}\)，即χ²分布的界值。由(χ²界值表)可知，χ²值愈大，P值愈小；反之，χ²值愈小，P值愈大。χ²检验时，先计算检验统计量χ²值，然后按自由度ν查(χ²界值表)，确定P值。

(三) χ²分布的作用

可用χ²分布近似描述具有某种属性的实际频数A_i与理论频数T_i之间的抽样误差，即：

\( \chi^2=\sum\frac{(A_i-T_i)^2}{T_i} \)

如果样本含量和理论频数均较大(如n≥40，T_i≥5)，或自由度大于1时，近似程度较好。因此，χ²分布除可用于方差的抽样分布研究外，还可用于样本分布与理论分布的拟合优度检验、率或构成比的比较等。

二、χ²检验的基本思想

现以两样本率比较的χ²检验为例，介绍χ²检验的基本思想。

(一) 案例介绍

某中医院欲比较某经典名方控制高血压的效果。将200例高血压患者随机分到试验组(Trial group)和对照组(Control group)，随访三个月后患者的血压控制情况[分为有效(Effective)和无效(Noneffective)]。问该经典名方控制血压的效果如何？数据见图2。

本例只有(a、b、c、d)4个数是基本数据，其余数据都是由这4个基本数据推算所得，故称为四格表(fourfold table)资料。整理出检验所需数据见图2。其中组别一般作为行变量，疗效一般作为列变量。通过数据可计算出试验组的血压控制率为56.89%，对照组为19.23%，但这两者所代表的总体率间确实有差异，还是由于抽样误差所致，需要通过假设检验来回答。当两样本含量比较大或两样本率近似服从正态分布时，则既可用u检验(Z检验)也可用χ²检验来推断两总体率是否有差别，且两种检验方法是等价的。对同一份资料有u²=χ²

(二) 建立检验假设，确定检验水准

该案例的无效假设为H₀：π₁=π₂，即试验组和对照组的总体血压控制率相等。若该假设检验成立，两种方法的疗效应当相同，即200名患者中有104名有效，合计有效率为52%，合计无效率为48%。

(三) 计算理论频数

在无效假设成立的条件下，可以推算每个格子的理论频数(theoretical frequency)，用T表示。如，H₀：π₁=π₂成立，那么理论上，试验组的174例高血压患者中血压控制有效的理论人数T₁₁应为174×52%=90.48人(四格表第一行、第一列，即第一个格子)，血压控制无效的理论人数T₁₂为174×48%=83.52人(四格表第一行、第二列，即第二个格子)；同理，对照组的26例高血压患者中血压控制有效的理论人数T₂₁应为26×52%=13.52人(四格表第二行、第一列，即第三个格子)，血压控制无效的理论人数T₂₂为26×48%=12.48人(四格表第二行、第二列，即第四个格子)。由此可总结出列联表中第R行(row)第C列(column)格子的理论频数T_RC可表达为：

\( T_{R C}=\frac{n_{R} n_{C}}{n_{1}} \)

式中n_R为相应行的合计， n_c 为相应列的合计，n为总例数。

(四) 度量实际频数与理论频数之间的差异

使用Pearson χ²统计量可度量实际频数A与理论频数T之间的差异。

\(\chi^2=\sum\frac{(A-T)^2}{T}\)，ν=(行数－1)(列数－1)

(五) 作出统计推断

由卡方计算公式可知，若H₀：π₁=π₂成立，实际频数A与理论频数T之间的差异仅由抽样误差所致，不应太大，χ²会较小；反之，若检验假设H₀不成立，实际频数与理论频数的差值会较大，则χ²也会较大。此外，χ²的大小还取决于\(\frac{(A-T)^2}{T}\) 个数的多少(严格地说是自由度ν的大小)。由于各 \(\frac{(A-T)^2}{T}\)皆是正值，故自由度ν愈大，χ²值也会愈大；所以只有考虑了自由度ν的影响，χ²值才能正确地反映实际频数A和理论频数T的吻合程度。

若H₀成立，χ²值离0太远的概率比较小。设检验水准为α，在χ²分布中，右侧尾部面积为α时的临界值记为\(\chi_{a, v}^{2}\) ，可通过(χ²界值表)获得，即\(P\left(\chi^{2}\geq\chi_{a, v}^{2}\right)=\alpha\)。根据假设检验的基本思想，当在单次抽样中获得的\(\chi^{2}\geq\chi_{a, v}^{2}\)时，P≤a，则认为发生了H₀成立条件下的小概率事件，继而做出拒绝H₀、接受H₁的统计推断；反之 \(\chi^{2}<\chi_{a, v}^{2}\) 时，P＞a，此时不拒绝H₀。

需要注意的是，χ²分布本身是一种连续型随机变量的概率分布，而基于频数计算的χ²值是离散的，不可能取[0，+∞)的任意值，因此χ²只是近似服从χ²分布，只有当样本例数或理论频数足够大时，这种近似才较好，进行χ²检验才是有效的。

我要纠错

End

四格表资料的卡方检验(χ² Test)——理论介绍