单因素方差分析(One-Way ANOVA)—jamovi软件实现

发布于 2022年6月23日 星期四 22:18:52 浏览:4813
原创不易,转载请注明来源,感谢!
附件下载:
单因素方差分析.zip 请勿重复点击,如无响应请耐心等待或稍后再试。

在前面文章中介绍了单因素方差分析(One-Way ANOVA)的假设检验理论,本文将实例演示在jamovi软件中实现单因素方差分析的操作步骤。

关键词:jamovi; 单因素方差分析; F检验; Welch检验; 韦尔奇检验; 事后检验; 两两比较

一、案例介绍

某医生用A(代码为1)、B(代码为2)、C(代码为3)三种方案治疗血红蛋白低下的贫血患者,治疗两个月后,记录每名受试者血红蛋白的上升克数。问3种治疗方案对患者贫血的疗效是否有差别?对数据的变量进行标签赋值后部分数据见图1。本文案例可从“附件下载”处下载。

图1

二、问题分析

本案例的分析目的是比较3种治疗方案对患者贫血的疗效是否有差别,即判断3种治疗方案患者的血红蛋白上升克数是否存在差异。针对这种情况可以使用单因素方差分析。但需要满足六个条件:

条件1:观察变量为连续变量。本研究中的血红蛋白上升克数为连续变量,该条件满足。

条件2:观测值相互独立。本研究中各研究对象的观测值都是独立的,不存在互相干扰的情况,该条件满足。

条件3:观察变量可分为多组(≥3)。本研究中分为A、B、C三组,该条件满足。

条件4:观察变量不存在显著的异常值,该条件需要通过软件分析后判断。

条件5:各组观察变量为正态(或近似正态)分布,该条件需要通过软件分析后判断。

条件6:多组观察变量的整体方差相等,该条件需要通过软件分析后判断。

三、软件操作及结果解读

(一) 适用条件判断

1. 条件4判断(异常值判断)

(1) 软件操作

① 选择“分析”—“探索”—“描述”,将观察变量“血红蛋白”选入右侧“变量”框,将“分组”选入右侧“拆分”框(图2)。

图2

② 在“统计”下的“样本量”中勾选“个案数”、“缺失”,在“集中趋势”中勾选“均数”、“中位数”,在“离散”中勾选“标准差”、“最小值”和“最大值”(图3),结果如表1所示。

图3
表1

③ 在“绘图”下的“箱线图”中勾选“箱线图”和“数据”,“数据”下拉菜单中选择“散点”(图4),结果如图5所示。

图4
图5
(2) 结果解读

表1“描述”表格中,列出了各组观察变量的最小值和最大值,依据专业可判断血红蛋白的上升克数均可能存在0.1g和3.7g的情况;此外,图5中的箱线图也未提示任何异常值。综上,本案例未发现需要处理的异常值,满足条件4。

2. 条件5判断(正态性检验)

(1) 软件操作

单因素方差分析时,需要分别对每一组数据的正态性进行检验,因此需要使用拆分功能 (见图2)。

① 在“绘图”下勾选“Q-Q图”(图6),结果如图7所示。

图6
图7

② 在“统计”中勾选“Shapiro-Wilk检验”(图8),结果如表2所示。

图8
表2
(2) 结果解读

图7和表2按照组别列出了三组的分析结果。图7的Q-Q图上三组散点基本围绕对角线分布,提示三组数据呈正态分布;表2的正态性检验结果分别显示三组的P=0.296、0.486、0.435,均>0.1,也提示三组数据满足正态分布。综上,本案例满足条件5。

3. 条件6判断(方差齐性检验)

(1) 软件操作

① 选择“分析”—“探索”—“描述”,在“离散”中勾选“标准差”和“方差”(图9),结果如表3所示。

图9
表3

② 选择“分析”—“方差分析”—“单因素方差分析”;将“血红蛋白”选入右侧“因变量”框,将“分组”选入右侧“分组变量”框(图10)。

图10

③ 在“适用条件判断”中勾选“方差齐性检验”(图11),结果如表4所示。

图11
表4
(2) 结果解读

由表3“描述”表格中“标准差”和“方差”结果可知,A、B、C三组的标准差分别为0.867、0.738、0.538,方差分别为0.752、0.545和0.290,三组的方差数值貌似存在差异,但还需要依据统计学检验的结果进行判断。

表4“方差齐性检验(Levene’s)”为方差齐性检验结果,可见F=2.610,P=0.080<0.1,提示三组数据方差不齐,不满足条件6。

(二) 统计描述及推断

1. 软件操作

选择“分析”—“方差分析”—“单因素方差分析”,按照图12勾选相应选项。

图12

2. 结果解读

(1) 统计描述

表5“分组描述”表格中提供了研究案例的 “分组”、“个案数”、“均值”、“标准差”和“标准误”。可知,A、B、C三组血红蛋白的上升克数分别为1.688±0.867 g、1.250±0.738 g和1.023±0.538 g。图13为三组血红蛋白上升克数的分布图。三组数值貌似存在差异,但还需要依据统计学检验的结果进行判断。

表5
图13
(2) 统计学推断

表6“单因素方差分析”表格中提供了单因素方差分析(Fisher’s)和校正单因素方差分析(Welch’s)两种方法分析的统计量、组内自由度、组间自由度及P值。由于本案例满足条件1—5,但不满足方差齐性,所以采用校正单因素方差分析(Welch’s)法的结果,F=5.477,P=0.007;提示各组均数不全相等(至少有两组均数不相同)。

表6

在jamovi中,单因素方差分析除了可以通过“单因素方差分析”模块实现,还可以通过“方差分析”模块实现。在“方差分析”模块还可计算效应量。其软件操作如图14所示,结果如表7所示。

图14
表7

表7“方差分析-血红蛋白”表格中分析结果与表6 “单因素方差分析”Fisher’s法结果完全一致表7结果中还提供了效应量η²、η²p和ω²,分别为0.130、0.130和0.106,效应量为中等。

(三) 事后检验(两两比较)

上面分析得出了“各组均数不全相等”的结论,但是到底是哪些组别之间存在差异尚不清楚,因此需要进行事后检验,开展两两比较。

1. 软件操作

选择“分析”—“方差分析”—“单因素方差分析”,在“事后检验”框中按照图15勾选相应选项,结果如表8所示。因为本案例不满足方差齐性,所以选择“Games-Howell (方差不齐)”法。

图15

2. 结果解读

表8“Games-Howell事后检验-血红蛋白)”表格中提供了各组两两比较的“均数差”、“统计量”、“自由度”和“P值”。可知,A组和B组之间的差异为0.438g,但差异无统计学意义(t=1.963,P=0.132);A组和C组之间的差异为0.665g,差异有统计学意义(t=3.324,P=0.005);B组和C组之间的差异为0.227g,差异无统计学意义(t=1.266,P=0.421)。因此,可知A组血红蛋白的上升克数比C组高0.665g,差异有统计学意义(t=3.324,P=0.005)。

表8

四、结论

本研究采用单因素方差分析判断3种方案治疗患者贫血的血红蛋白上升克数是否存在差异。通过专业知识判断,三组数据不存在需要删除的异常值;通过绘制Q-Q图和Shapiro-Wilk检验,提示三组数据满足正态分布;通过Levene’s检验,提示三组数据间方差不齐,采用校正单因素方差分析(Welch’s)法分析数据。

分析结果显示,A、B、C三组血红蛋白的上升克数分别为1.688±0.867 g、1.250±0.738 g和1.023±0.538 g,三组均数不全相等(F=5.477,P=0.007)。进一步采用Games-Howell法进行两两比较,显示A组血红蛋白的上升克数比C组高0.665g,差异有统计学意义(t=3.324,P=0.005);A组血红蛋白的上升克数比B组高0.438g,但差异无统计学意义(t=1.963,P=0.132);B组血红蛋白的上升克数比C组高0.227g,但差异无统计学意义(t=1.266,P=0.421)。因此,A、B、C三种治疗方案对治疗贫血患者疗效不一样,A方案疗效最好。

五、知识小贴士

  • η²、η²p和ω²为效应量指标,在单因素方差分析中,η²和η²p相等。η²p是指在控制了其他自变量后,因变量被目标自变量解释的程度,即组间的差异可被干预因素解释的程度。η²p效应量<0.01为极小效应,0.01~0.06为小效应,0.06~0.14为中等效应,>0.14为大效应。与η²p相比,ω²还考虑了抽样误差,可以提供更加准确的总体效应量估计。
  • “ANOVA (方差分析)”模块下未提供校正单因素方差分析(Welch’s)法。

六、分析小技巧

  • 严格来讲,单因素方差分析时,需要分别对每一组数据的正态性进行检验。但方差分析对数据非正态性具有一定的耐受力,如果数据不是严重偏态或者只有部分组别数据不满足正态性要求,出于参数检验的统计学效能优于非参数检验的角度,还是可以使用单因素方差分析方法,而不使用非参数检验。
  • jamovi在“单因素方差分析”和“方差分析”模块下的“适用条件判断”中均提供了“正态性检验”和“绘制Q-Q图”功能可检验数据的正态性情况,但此处检验的是数据的整体正态分布(感兴趣的读者请自行操作)。正如上所述,单因素方差分析对数据非正态性具有一定的耐受力,如果数据满足整体正态分布,也是可以使用该种分析方法。但我们建议尽可能分组别检验数据的正态性。
  • 对于不是特别严重的方差不齐,单因素方差分析提供了校正检验方法(Welch one-way ANOVA/ Welch’s F检验),考虑了方差差异之后的更为稳健的分析结果。但当组间方差差异较大时,校正结果也不一定可信,建议使用非参数检验(Kruskal-Wallis检验)。如果数据正态性和方差齐性都不满足,最好使用非参数检验(Kruskal-Wallis检验)。
  • 多重比较一般分为事前检验(Prior tests)和事后检验(Post hoc tests)。事前检验是指在数据收集之前便决定了要通过多重比较来考察多个组与某个特定组之间的差别,多根据专业意义设定比较的策略。如果是事前检验,不论整体分析的结果如何,均可进行比较,并且一般不需要对检验水准进行太多修正。事后检验只有在方差分析得到有统计学意义的F值后才有必要进行,是一种探索性分析。对于事先未计划的多重比较(即事后检验),各组间的差别只是一种提示,要确认这种差别最好重新设计实验。
  • jamovi在“单因素方差分析”和“方差分析”模块下的“事后检验”中均提供了多重比较的方法。“单因素方差分析”方法下的事后检验提供了“Games-Howell (unequal variances)”法和“Tukey (equal variances)”法两种方法,前者为方差不齐时使用,后者为方差齐时使用。“方差分析”方法下的事后检验提供了“Tukey”法、“Scheffe”法、“Bonferroni”法和“Holm”法四种方法,均为在方差齐时使用。其中“Bonferroni”法为对检验水准的严格校正,校正后的检验水准为原始检验水准除以比较次数,当两两比较的次数较多时,结果偏保守。“Holm”法对检验水准的校正程度不如“Bonferroni”法严格,结果更为稳健。Scheffe法的检验效能优于Bonferroni法。Tukey法使用时需要样本数目相同,并可能产生较多的假阴性结果。
End
文章目录 沉浸式阅读