jamovi——一款为医护人员量身定做的数据分析软件新宠

发布于 2022年4月6日 星期三 12:21:01 浏览:6347
原创不易,转载请注明来源,感谢!

在医学科研中,统计学的作用举足轻重,但对许多临床医护人员来说,能熟练使用一门专业统计软件进行数据分析是一个较大的挑战,这不仅是因为医学统计学具有很多理论和计算公式,更为重要的原因是目前的主流统计分析软件学习难度较大,不易上手。SAS、Stata和SPSS三大老牌统计分析软件均是收费软件(你没交过费,不代表是免费的哦),其中SAS和Stata是主流编程软件,对于非统计学专业的医护人员来说要花相当多的精力才能进入学习轨道。对于大家使用最为广泛的SPSS软件(这款以菜单式操作为主要特征的分析软件功能应该说是非常强大了),也面临一个突出问题就是泛模块化(或叫“模块灾难”)和参数选项泛滥化。对于非统计学专业的医护人员来说,五彩缤纷的模块足以让初学者眼花缭乱,其中很多分析方法或者参数设置选项可能这一辈子也不会用到。相比上面三个收费软件,在免费软件里最为耀眼的就属R了,但是很多人一听到R,基本就止步于那犹如天书的编程代码……

图1SPSS操作页面

难道统计分析就是统计学专业人员的独宠吗?就真的没有一款既实用又容易学习的统计专业软件能让广大临床医护人员走进统计学的世界吗?答案是否定的!

今天我们就为大家全面介绍一种国内还鲜为人知的统计软件新宠:jamovi,一款几乎就是专门为医护人员量身定做的统计分析软件。

是不是有点疑惑,既然这么好的软件为啥没人用啊,甚至还未听说过?这一点也不奇怪,因为按年龄来算人家还是个小baby。SPSS诞生于1968年,现在53岁;SAS诞生于1976年,现在45岁;Stata诞生于1985年,现在36岁。那么jamovi呢?诞生于2016年,现在仅5岁,的的确确是个小萌宠呢。下面我们就一起来认识一下这个小萌宠吧。

一、jamovi简介

jamovi是一款新兴的专业数据统计分析软件,免费、开源、集SPSS分析模块界面化特点和R软件强大程序编辑功能为一体,由软件工程师Jonathon Love、Damian Dropmann和 Ravi Selker领衔开发,其最初开发是面向心理学的,但是随着发展也逐渐应用到其他学科中。jamovi适用于多种操作系统及应用平台,具有友好的“一键式”界面操作菜单,涵盖数据准备、数据管理、统计分析、报表制作、图形绘制等多种功能。目前,jamovi在国外已被广泛使用,但在国内还应用较少。

使用jamovi对数据进行统计分析,只需要通过选择菜单、填写对话框和点击按钮等简单操作即可完成,免去了复杂的程序编辑环节。分析过程,不仅可以同步得到标准数字图表,还可产生美观、高清的统计图;这些结果均可被便捷地导出、复制或粘贴。jamovi可以实现数据的实时编辑与管理,相应的统计分析结果也会在输出窗口及时更新,极大地提高了工作效率。目前,常用的医学统计分析方法在jamovi中都已被模块化,用户可灵活地选择加载和启用。jamovi另一个重要的功能就是可以有效地衔接R语言,通过Rj Editor实现所有R软件的数据处理功能。

下图就是jamovi的容貌,是不是长得很简洁?

图2 jamovi主页面

二、jamovi的七大特点

(一) 免费、开源

你的确没有听错,免费!重要的事情说三遍,免费、不收钱、free!jamovi软件免费、开源,可以在多平台下载使用,是一款不用付费就能使用的正版统计软件。使用过主流统计软件的人,应该都经历过在网上到处搜破解版的经历(富豪此处飘过),时不时还给你报个错、限制个功能啥的,我想单凭这个优点就有足够的理由让大家对jamovi奔走相告。话说“为众人抱薪者,不可使其冻毙于风雪”!哦,不对,应该是“酒好不怕巷子深”,相信越来越多的人都会来品尝这款美酒。

(二) 友好的操作界面

这个或许是jamovi最为靓丽的优点了。jamovi的整个页面就只有三个视图栏:“主菜单栏”、“操作视图栏”和“结果视图栏”。避免模块之间的套叠和叠加是研发人员设计这款软件的重要初衷。

图3 jamovi操作页面

所有分析操作只需要从“主菜单栏”选择相应的分析方法,然后在左边“操作视图栏”勾选相应的选项,其结果就会实时更新显示在右边的“结果视图栏”。千万不要忽略“实时更新”四个字,这对众多非统计学人员来说真的太重要了,在jamovi中只要点击任何“操作视图栏”的选项,其相应的分析结果就会立刻呈现在右边的“结果视图栏”,取消选项,结果也会随之消失!因此,使用jamovi进行数据分析根本不存在复杂的操作和繁多的参数设置,初学者只要多点几次选项就能明白这个参数的意义(结果就在右边难道还不够直接吗?)

如果说的还不够清楚,那再看看视频吧!

(三) 灵活安装模块,避免“模块灾难”

初看jamovi的分析方法,感觉有点少啊(图4),貌似不够用呢!其实这个“主菜单栏”上面的几个方法只是人家的展览架,放了几个常用的展品而已,更多的宝贝在人家的百宝箱里,看到了右边的“Modules(模块加载)”了吗?这个就是百宝箱的入口,进入以后点击“jamovi library(模块图书馆)”,就进入了百宝箱内部(图5)。那么里面到底有多少方法呢?目前是40多类方法,注意是类不是种。什么意思?如下面“ANOVA(方差分析)”模块就是一个类,里面包括了“One-Way ANOVA(单因素方差分析)”、“ANOVA(多因素方差分析)”、“Repeated Measures ANOVA(重复测量的方差分析)”、“ANCOVA(单因素协方差分析)”、“MNCOVA(多因素协方差分析)”、“Kruskal-Wallis H检验”、“Friedman检验”等多种分析方法(图6)。此外,jamovi模块图书馆中的方法类别还在随时不断补充更新,今后会越来越多。你还会觉得方法不够用吗?

图4 jamovi主菜单栏默认列出的方法 
图5 jamovi的模块图书馆 
图6 “ANOVA(方差分析)”模块包括的分析方法

其实,这就是jamovi的另一个优点:可扩充性。在主菜单栏包含了常用的统计分析模块,若想实现更多的统计分析如元分析、功效分析、中介与调节模型分析、贝叶斯方法等可通过加载模块(Modules)的方式实现方法扩充,这种方式很好地规避了过多的模块使得主菜单或模块列表过于拥挤,造成分析模块的选择和操作的不便。如果你是一个方法学的追逐者,还是觉得这些方法不够用怎么办呢?没有关系,看jamovi的下一个优点。

(四) 集成R的庞大功能

这个功能就要从jamovi的“无敌金身”说起。jamovi其实是基于R语言开发的一款开源、免费统计分析软件,只要R语言能实现的,通过jamovi就能实现。jamovi中许多模块与R语言程序包的功能几乎完全相同。换言之,在加载了相应模块后,可以通过菜单式的操作,得到R语言级的分析结果,间接体验R的功能。每个分析结果下面的“References(参考文献)”就是R源代码的来源,要想深入剖析,点击查看即可(图7)。

图7 jamovi中每种方法的源代码文献

此外,在jamovi中,还可以通过两种方式直接体验R语言。即jamovi自带的版本(jamovi R)和我们已经安装的R语言(System R)(图8)。jamovi R可以满足基本需求,System R可以调用在自己的R中已安装过的程序包(需要先安装R语言,并安装程序包:jmvconnect)。Rj Editor带有基础函数提示功能,键入函数的前几个字母后,便会关联出多个函数供用户选择,这能帮助初学者快速找到想用的函数(图9)。其分析结果就像RStudio一样,动态显示在右边的“结果视图栏”(图10)。 

图8 jamovi中R操作过程 
图9 jamovi中Rj Editor函数关联功能 
图10 jamovi中Rj Editor分析结果页面

(五) 分析操作最简化

jamovi充分考虑了每种统计方法的分析思路和实现流程,将操作步骤进行精简,使用者只需要用最少的操作步骤就可实现分析目的。参数设置页面都清晰地列在左侧的“操作视图栏”,不存在任何模块重叠,操作流程非常简单。下面就看两个例子吧!

比如两独立样本t检验,先判断适用条件(正态性和方差齐性),只需要点击左侧“Assumption Checks(假设检验条件判断)”下的“Normality test(正态性检验)”就可在右边显示正态性检验的结果;点击“Homogeneity test(方差齐性检验)”就可在右边显示方差齐性检验的结果;点击“Q-Q plot(绘制Q-Q图)”就可在右边显示Q-Q图(图11—图12)。然后进行假设检验,在“Tests(假设检验)”下提供了“Student’s (学生t检验,即独立样本t检验)”以及方差不齐的校正t检验(Welch’s t)和非参数检验(Mann-Whitney U检验)结果。只需要点击相应选项,就可在右边显示对应的分析结果(图13)。此外,点击“Additional Statistics(附加分析)”下的“Mean difference (均数差)”及“95% Confidence Interval (95%可信区间,95%CI)”就可在右边显示两组数据的均数差及95%CI;点击“Effect Size (效应量)”及“95% Confidence Interval (95%可信区间)” 就可在右边显示效应量Cohen’s d(科恩d值)及其95%CI(图14)。

图11 jamovi中两独立样本t检验时正态性和方差齐性检验 
图12 jamovi中两独立样本t检验时绘制Q-Q图
图13 jamovi中两独立样本t检验时进行统计学推断和替代分析方法选择 
图14 jamovi中两独立样本t检验时计算均数差、效应量及其95%可信区间

以上这些分析在实际操作过程中只需要几十秒钟时间,来看看这个视频。

如果说两独立样本t检验尚未体现出jamovi操作最简化特点,那么回归分析过程绝对会让你对jamovi爱不释手。

大家是否还记得在SPSS中进行多重线性回归分析时哑变量设置的步骤呢?首先需要通过“Transform(转换)”—“Create Dummy Variables(创建虚拟变量)”过程产生n个哑变量(n为变量的水平数)(图15—图16,以Income“收入水平”为例),然后在多重线性回归分析时哑变量需要同进同出模型(即将“Income_2”和“Income_3”同时选入模型,此时“Income_1”是参照水平)(图17)。而在jamovi中进行多重线性回归分析时哑变量可以直接选择,非常简单(图18)。我们再想想在SPSS中进行logistic回归分析时哑变量的设置,是不是只能选择第一个水平和最后一个水平为参照?而在jamovi中可以想选哪个选哪个(图18),不一定要选择第一个和最后一个。

图15 SPSS中对“Inconme(收入水平)”生成哑变量 
图16 SPSS中对“Inconme(收入水平)”生成了n个哑变量
图17 SPSS中进行多重线性回归分析时哑变量需要同进同出模型 
图18 jamovi中进行多重线性回归分析时哑变量可以直接选择 

那我们再来看看回归分析过程中另一个重要的环节:自变量筛选,这个问题一直是大家讨论的热点。在SPSS中进行多重线性回归分析时,提供了“Enter(输入法)”、“Stepwise(逐步法)”、“Remove(移除法)”、“Backward(后退法)”、“Forward(前进法)”五种自变量筛选方法(图19);在logistic回归分析时提供了“Enter(输入法)”、“Forward: Conditional(向前条件法)”、“Forward: LR(向前LR法)”、“Forward: Wald(向前Wald法)”、“Backward: Conditional(向后条件法)”、“Backward: LR(后向后LR法)”、“Backward: Wald(向后Wald法)”七种自变量筛选方法(图20)。这么多方法,到底应该使用哪种自变量筛选方法并没有定论,实际数据分析过程中,我们往往会碰到尴尬的情况就是不同的分析方法计算出来的结果却不一致。在jamovi中完全没有这些烦恼,“Omnibus ANOVA Test (整体方差分析)”功能会自动检验每个自变量在模型中是否有统计学意义,即是否应被纳入模型(图21);“Model Comparisons (模型比较)”功能也会列出每个模型新增一个自变量后与上一个模型相比决定系数的差异 (ΔR²)是否有统计学意义,也即表示新加入的变量是否有统计学意义(图22)。 

 图19 SPSS中进行多重线性回归分析时自变量筛选方法 
图20 SPSS中进行logistic回归分析时自变量筛选方法 
图21 jamovi中进行回归分析时“Omnibus ANOVA Test (整体方差分析)”功能会自动检验每个自变量在模型中是否有统计学意义 
图22 jamovi中进行回归分析时“Model Comparisons (模型比较)”功能会检验新加入的变量是否有统计学意义

(六) 重视方法的适用条件

jamovi充分考虑了每种统计方法的适用条件,并且将适用条件判断研发了一个单独的模块“Assumption Checks(假设检验条件判断)”嵌入每种方法的操作界面。哪怕你只是一个统计学的初学者,在jamovi中也不必担心忘记判断适用条件或者不知道判断哪几个条件的问题,比如:

两独立样本t检验时需要使用的“Normality test(正态性检验)”和“Homogeneity test (方差齐性检验)”(图23)。 

图23 jamovi中开展两独立样本t检验时的“Assumption Checks(假设检验条件判断)”

重复测量方差分析中需要使用的“Sphericity tests (球形度检验)”、 “Homogeneity test (方差齐性检验)”和“Q-Q plot(Q-Q图判断正态性)”(图24)。 

图24 jamovi中开展重复测量方差分析时的“Assumption Checks(假设检验条件判断)”

线性回归分析时需要使用的“Autocorrelation test (自相关检验)”、“Collinearity statistics (共线性诊断)”、“Normality test (正态性检验)”和“Q-Q plot of residuals (残差Q-Q图)”、方差齐性检验的“Residuals plots(残差图)”、异常值检测的“Cook’s distance (库克距离)”计算(图25)。

 图25 jamovi中开展线性回归分析时的“Assumption Checks(假设检验条件判断)”

主成分分析时需要使用的“Bartlett’s test of sphericity (Bartlett球形度检验)”和“KMO measure of sampling adequacy (KMO抽样适合性检验)”(图26)。 

图26 jamovi中开展主成分分析时的“Assumption Checks(假设检验条件判断)”

(七) 重视效应量的计算

效应量是个啥,是不是还没听说过?这并不能怪你,因为平时大家都不太重视它,其实它是一个非常重要的指标。效应量是指由于因素引起的差别,是衡量处理效应大小的指标。与显著性检验不同,效应量不受样本量的影响。

你是否遇到过这种情况:当样本量较大时,很容易出现P<0.05的情况,哪怕此时组间的实际差别很小。是的,这种现象非常常见,这也说明P值并不那么可靠,当样本量较大时,很有必要报告效应量的大小。二项logistic回归分析时的OR值、Cox回归分析时的HR值其实就是效应量,但统计学分析过程中的效应量远远不止这么几个。

jamovi很重视效应量的计算(其实大家也越来越重视了),几乎每种差异性分析或者关联分析方法中均设置了计算“Effect size(效应量)”及95%可信区间的选项(图27)。比如:

t检验中,报告的是Cohen's d (科恩d值)效应量;判断标准为:绝对值<0.2为极小效应,0.2~0.5为中等效应,0.5~0.8为较高效应,≥0.8为高效应。

在方差分析中,报告的是η²、η²p和ω²效应量;η²与η²p效应量<0.01为极小效应,0.01~0.06为小效应,0.06~0.14为中等效应,>0.14为大效应。与η²p相比,ω²还考虑了抽样误差,可以提供更加准确的总体效应量估计。

二分类变量之间的关联程度报告的是φ系数(phi coefficient)、Cramer V系数(Cramer’s V coefficient)和Pearson列联系数(Contingency coefficient)效应量。多分类变量或者等级变量之间的关联程度报告的是Cramer V系数和列联系数。这三个系数越接近0,说明关联性越弱;越接近1,说明关联性越强。当系数<0.1时为极弱相关,0.1~0.3时为弱相关,0.3~0.5时为中等相关,>0.5时为强相关。

单样本Wilcoxon符号秩检验、Mann-Whitney U检验和配对样本Wilcoxon符号秩检验报告的是Rank biserial correlation (秩二列相关系数)效应量,Kruskal-Wallis H检验报告的是ε²效应量。

相关性分析报告的是Pearson相关系数、Spearman相关系数和Kendall’s Tau-b相关系数,当0.9</r/<1,为高度相关;当0.7</r/<0.9,为强相关;0.4</r/<0.7,为中度相关;0.2</r/<0.4,为弱相关性;0</r/<0.2,为极弱相关或无相关性。

线性回归分析报告的是Estimate(非标准化回归系数)及Stand. Estimate (标准化回归系数),logistic回归分析报告的是Estimate(回归系数)及Odds ratio (OR值),Cox回归分析报告的是Hazard Ratio(HR值)。

图27 jamovi中常用统计分析方法报告的效应量

三、jamovi的安装

说了这么多,那么jamovi如何下载和安装呢?

jamovi软件可以从jamovi官网中免费下载,官方网址为:https://www.jamovi.org/ 。打开网址进入官网首页后,选择右上角“download”(图28),进入下载页面。 

图28 jamovi官网页面

下载页面中提供了不同系统、不同版本的jamovi软件。Windows系统(只支持64位操作系统)、MacOS系统、Linux系统、ChromeOS系统都支持jamovi的安装。下载页面中current、solid、legacy分别表示最新版、稳定版、旧版本,使用者可以根据需要自行选择。当前比较稳定的版本是1.6.23,建议安装此本版本。如果希望尝试新功能的,可以安装更高版本,目前最新版本为2.0.0。

软件安装这个就不必再浪费大家的时间了,直接点击“Install (安装)”一键式完成(图29),连“下一步”都不用点击!就是这么简单。 

图29 jamovi安装

数据统计分析是医学科研过程中必不可少的组成部分,随着信息化技术的不断发展,诸多医学统计学方法的演算过程完全可通过计算机自动实现,这使得数据分析过程也不再枯燥无味,jamovi的出现无疑使这个过程更加简单和有趣。随着更多模块开发人员的加入,通过jamovi “一键式”操作能够实现的统计分析方法将越来越多,鉴于其开源、免费和操作简便的优点,我们相信jamovi也必将被越来越多的数据分析人员所喜爱。这么好的软件,你难道不想自己试试并推荐给大家?

End
文章目录 沉浸式阅读