关键词:方差齐性; 方差齐性检验; SPSS; F检验; Bartlett法; Levene法
一、方差齐性检验的方法概述
方差齐性要求各样本的总体有着相同的方差,也即总体的分布一致。样本之间的方差齐性主要依靠假设检验来判断,在进行独立样本t检验和方差分析时,与数据不满足正态性相比,方差不齐对结论的影响会更大。常见方差齐性检验的方法如下:
(一) F检验
F检验通过计算样本中最大方差和最小方差的比值来构建统计量,并将此统计量和1进行比较。其统计量为:
\(F=\frac{S_{1}^{2} \text { (较大) }}{S_{2}^{2} \text { (较小) }}\)
当样本方差相等时,F统计量应接近1。F检验只适用两组总体方差是否相等的判断,且要求资料服从正态分布总体。
(二) Bartlett法
Bartlett法通过比较各组方差的加权算术均数与几何均数来构建统计量,由于几何均数不会超出算数均数,如果各组总体方差相等,那么样本方差之间不会相差很大,比值接近1;反之,若二者差异过大,可认为各组间的方差不齐。由于其判断依据是不同样本分布的“拖尾”大小,因此,该方法对分布的非正态十分敏感,即总体方差有显著差别或者总体分布的偏斜程度有所不同,Bartlett法检验的结果都可能有统计学差异。因此在使用该方法之前,需要首先判断样本间的分布是否一致,如果不一致,则不适合使用该方法。实际数据分析过程中最简单的做法就是要求各组样本资料具有正态性。其统计量为:
\(\chi^{2}=\frac{\sum_{i=1}^{g}\left(n_{i}-1\right) \ln\frac{s_{c}^{2}}{s_{i}^{2}}}{1+\frac{1}{3(g-1)}\left\{\sum_{i=1}^{g}\left(n_{i}-1\right)^{-1}-\left[\sum_{i=1}^{g}\left(n_{i}-1\right)\right]^{-1}\right\}}\)
式中\(s_{c}^{2}\) 为合并方差,计算公式为:
\(s_{c}^{2}=\sum_{i=1}^{g}\left(n_{i}-1\right) s_{i}^{2}/ \sum_{i=1}^{g}\left(n_{i^{-1}}\right)\)
Bartlett检验在样本量小于5的情况下结果不稳定,因此有人提出了修正的Bartlett检验法,无存在大样本和小样本下均能更好地服从卡方分布,可以显著提高检验精度。
(三) Hartley法
Hartley检验通过计算样本中最大方差和最小方差的比值来构建统计量,并将此统计量和抽样分布中的临界值进行比较。其统计量为:
\(H=\max \left(S_{i}^{2}\right) / \min\left(S_{i}^{2}\right)\)
当样本方差相等时,H统计量应接近1,H值越大表明样本间方差差异越大。但该方法只适用于每组样本量相同,且样本来自正态分布总体的资料。
(四) Cochran'C法
Cochran′C检验通过计算样本中最大方差和所有方差的比值来构建统计量,并将此统计量和抽样分布中的临界值进行比较。其统计量为:
\(C=\max \left(S_{i}^{2}\right) / \sum_{i=1}^{k}S_{i}^{2}\)
与Hartley检验一样,也需要每组样本量相等且都是正态分布。
(五) Levene法
以上四种方法都要求所检验的样本来自正态分布总体,Hartley法和Cochran'C法还要求各组样本量相同,Levene法对此并无要求,因此被广泛应用。Levene法的基本思想是将各组变量值中心化后,利用F值检验来判断各组间的差别。其统计量为:
\(F=\frac{(N-g) \sum_{i=1}^{g}n_{i}\left(\bar{z}_{i}-\bar{Z}\right)^{2}}{(g-1)\sum_{i=1}^{g} \sum_{j=1}^{n}\left(z_{ij}-\bar{z}_{i}\right)^{2}}\)
SAS、SPSS、jamovi等软件都默认采用Levene法。
二、方差齐性检验的SPSS实现
(一) 案例数据
某医生研究某生化指标(X)对病毒性肝炎诊断的临床意义,测得20名正常人和19名病毒性肝炎患者生化指标(X)含量(μg/dl),欲比较病毒性肝炎患者和正常人生化指标(X)含量是否存在差异,试分析该指标在两组间的方差是否满足齐性要求。部分数据见图1。
(二) 方法一
在SPSS软件“Explore(探索)”分析模块中可以对两组及多组之间的方差齐性进行统计学检验。
1. 软件操作
①选择“Analyze(分析)”—“Descriptive Statistics(描述统计)”—“Explore(探索)”(图2)。
②在“Explore(探索)”子对话框中,将分析变量“protein”选入“Dependent List(因变量列表)”,将分组变量“group”选入“Factor List(因子列表)”(图3),然后点击“Plots(图)”。
③在“Plots(图)”子对话框中勾选“Histogram(直方图)”和“Normality plots with tests(含检验的正态图)”,在“Spread vs Level with Levene Test(Levene方差齐性检验)”中选择“Untransformed(未转换)”(图4),点击“Continue(继续)”,然后点击OK。
2. 结果解读
首先需要观察两组人群某生化指标的标准差和方差,由图5“Descriptives(描述分析结果)”可知两组人群的标准差分别为9.17和13.70,方差分别为84.06和187.56,两组之间标准差和方差数值貌似存在差异,但还需要依据统计学检验的结果进行综合判断。
图6“Test of Homogeneity of Variance(方差齐性检验)”结果显示,F=3.883,P=0.056<0.1,提示两组数据方差不齐。
(三) 方法二
在SPSS软件“One-Way ANOVA(单因素方差分析)”模块中也可以对两组及多组之间的方差齐性进行统计学检验。
1. 软件操作
①选择“Analyze(分析)”—“Compare Means(均值比较)”—“One-Way ANOVA(单因素方差分析)”(图7)。
②在“One-Way ANOVA(单因素方差分析)”子对话框中,将分析变量“protein”选入“Dependent List(因变量列表)”,将分组变量“group”选入“Factor(因子)”(图8),然后点击“Options(选项”)。
②在“Options(选项”)子对话框中,勾选“Homogeneity of Variance test(方差齐性检验)”,点击“Continue(继续)”(图9),然后点击OK。
2. 结果解读
由图10“Test of Homogeneity of Variances(方差齐性检验)”结果显示,F=3.883,P=0.056<0.1,提示两组数据方差不齐。和方法一“Explore(探索)”分析模块中结果完全一致。
(四) 方法三
对于两独立样本t检验,SPSS软件在分析结果中会自动报告方差齐性检验的结果。此处软件操作过程略,结果如图11“Levene's Test for Equality of Variances(Levene方差齐性检验)”所示,F=3.883,P=0.056<0.1,提示两组数据方差不齐。和方法一“Explore(探索)”分析模块和方法二“One-Way ANOVA(单因素方差分析)”模块分析结果完全一致。
三、方差齐性检验的注意事项
(一) 方差齐性检验方法的选择
F检验、Bartlett法、Hartley法、Cochran'C法和Levene法五种检验方法中,前四种方法要求各组资料服从正态分布;Hartley法和Cochran'C法还要求各组间样本量相等;F检验只能适用于两组之间方差齐性检验,Bartlett法、Hartley法、Cochran'C法和Levene法既适合两组之间也适合多组之间方差齐性检验。
Levene法对组间样本量、正态性均无特殊要求,应用范围最为广泛。SAS、SPSS、jamovi等软件都默认采用Levene法。
(二) 注意样本量的影响
与数据不满足正态性相比,方差不齐对结论的影响较大,所以主要依靠假设检验进行考察。然而“Homogeneity of Variances Test (Levene's) (Levene's方差齐性检验)”的结果易受到样本量的影响,并不是很稳定。当样本量较大时,倾向于得出P值低于检验水准的结论,尽管可能组别之间的方差差异并不大;反之,当样本量较小时,尽管组别之间的方差差异可能较大,也倾向于得出P值高于检验水准的结论。因此,以统计学描述的形式报告各组数据的具体标准差和方差,并将其纳入综合考量是必要的。
(三) 检验水准
方差齐性检验的重要目的是减少II型错误,因此其检验水准一般取α=0.1或0.2,甚至更高。
(四) 方差不齐时的替代方案
对于不是特别严重的方差不齐,无论是t检验还是单因素方差分析都提供了校正检验方法,给出考虑了方差差异之后的更为稳健的分析结果。但当组间方差差异较大时,校正结果也不可信,建议使用非参数检验。