为了了解医护人员对统计软件的使用和需求情况,我们特意开展了一次专题调查。本次调查共收集了1202份问卷,其中1152份完整有效,有效问卷占比为95.84%。参与调查的对象主要为临床人员和护理人员(图1),本科和硕士学历为主(图2),职称分布比较均匀(图3)。
下面我们来看一下主要的结果。
问题1. “您正在使用哪些统计学软件?”
问题结果如图4所示。约有一半的调查对象使用SPSS,可见,SPSS为医护人员最常用的统计软件;其次excel使用者有21.6%(可能更多作为办公软件使用);Graphpad Prism由于其优秀的作图功能,使用者有10.9%,其次就是R语言、Stata和SAS等主流软件。
问题2:“您听说过以下哪些统计学软件?”
问题结果如图5所示。大致排序结果和图4差不多,只不过听过的比例高于使用的比例(这个能理解,没吃过猪肉还没见过猪跑吗?)
问题3:“您想学习哪些统计软件?”
问题结果如图6所示。大家还是想学习SPSS,因为操作简单;其次是R,因为R免费,作图也好看。当然还有21.6%的参与者啥也不想学,其实我们都想躺。
问题4:“如果您有机会学习一种新的统计学软件,您认为该软件具有的最重要的特征是什么?”
问题结果如图7所示。可见大家非常重视“上手快、容易学习”、“界面友好、操作简单”、“免费”。简单点就是好用不要钱!
问题5:“如果您有机会学习一种新的统计学软件,您最希望以什么方式学习?”
问题结果如图8所示。大家最喜欢视频课,一步一步操作看得见。
每款软件都有自己的特点,我们选择学习什么软件主要是根据自身的需求和实际情况,那么你是否知道到底有多少软件可供选择学习?每个软件的特点又是什么呢?今天我们就一起来了解一下常见的统计分析软件及特点。
首先就谈谈SPSS这个人气之王。
软件1 SPSS
SPSS是最早的统计分析软件,全称为统计产品与服务解决方案”(Statistical Product and Service Solutions)软件,由美国斯坦福大学的三位研究生Norman H. Nie、C. Hadlai (Tex) Hull 和 Dale H. Bent于1968年研究开发,并于1975年成立法人组织、在芝加哥组建了SPSS总部。2009年7月28日,IBM公司宣布收购SPSS公司。SPSS软件可从官网https://www.ibm.com/products/spss-statistics下载。
SPSS的特点可以简要归纳为以下4点:
(1) 功能强大
SPSS是一个组合式软件包,它集数据录入、整理、分析、结果报告功能于一身,囊括了各种成熟的统计方法与模型,为用户提供了全方位的统计方法。它将几乎所有的功能都以统一、规范的界面展现出来,使用Windows的窗口方式展示各种管理和分析数据方法的功能,对话框展示出各种功能选择项。用户只要掌握一定的Windows操作技能,精通统计分析原理,就可以使用该软件为特定的科研工作服务。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。输出结果十分美观,存储时则是专用的SPV格式,可以转存为HTML格式和文本格式。对于熟悉老版本编程运行方式的用户,SPSS还特别设计了语法生成窗口,用户只需在菜单中选好各个选项,然后按“粘贴”按钮就可以自动生成标准的SPSS程序。极大地方便了中、高级用户。
(2) 兼容性好
SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。随着自身产品线的不断完善,SPSS不同产品间的互补和兼容性也在不断加以改进,和其他软件之间的兼容性也较为理想。
(3) 易用性强
SPSS是世界上最早采用图形菜单驱动界面的统计软件,它最突出的特点就是操作界面极为友好、操作简单,且提供了中英文等多个语言版本,输出结果美观漂亮,使得统计分析人员对它“情有独钟”。事实上,不断地增强其易用性(而不是盲目追求方法的高精尖)几乎是近十几年来SPSS的核心改进方向。
(4) 扩展性高
SPSS长期以来一直为竞争对手所诟病的问题主要是它对新方法、新功能的更新速度很慢。对此,SPSS提供了一个巧妙的解决办法,就是直接和R进行对接,通过调用R的各种统计模块来实现对最新统计方法的调用,从而彻底解决了这一问题。另外,SPSS本身也向高级用户提供了编程功能,使分析工作变得更加节省时间和精力。
软件2 SAS
SAS(全称STATISTICAL ANALYSIS SYSTEM,简称SAS)是目前国际上权威的统计分析软件之一,由美国北卡罗来纳州立大学1966年开发。它由数十个专用模块构成,功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告编制、运筹学方法、计量经济学与预测等等。其官方网址为https://www.sas.com/。
SAS的特点可以简要归纳为以下3点:
(1) 功能强大,统计方法齐全
SAS提供了从基本统计数的计算到各种试验设计的方差分析、相关回归分析以及多变数分析的多种统计分析过程,几乎囊括了所有最新分析方法,其分析技术先进、可靠。分析方法的实现通过调用程序完成,同时提供了多种算法和选项。
(2) 使用简便,操作灵活
SAS编程语句简洁、短小,通常只需很小的几句语句即可完成一些复杂的运算,得到满意的结果。结果输出以简明的中文或英文给出提示,统计术语规范易懂,具有初步统计基础即可学习。
(3) 结果专业,认可度高
作为目前公认的最为权威的统计软件之一,得到了国际上的认可。SAS为用户提供了详实、专业的分析结果,世界五百强企业的前100名当中,绝大部分公司都在使用SAS。
软件3 Stata
Stata是一套提供了数据分析、数据管理以及绘制专业图表的整合性统计软件。其官方网址为https://www.stata.com/。
Stata的特点可以简要归纳为以下3点:
(1) 短小精炼,功能强大
Stata占用空间小,但是Stata在数据管理、统计分析以及制图等功能上与其他软件相比并没因规模小而显得逊色。在Stata中键入命令,提交执行后,随即就能得出结果。即使是计算量庞大的复杂调估算程序,也可以很快得出结果。最新版的Stata能够涵盖广泛的统计模型与技术,每次的更新升级,也使得Stata能够与最新的统计技术相匹配。
(2) 语法简单,易学易用
Stata以其简单易懂和功能强大受到初学者和高级用户的普遍欢迎。Stata的命令构成与语法结构都非常的简单明了,易学易用。相近统计模型的分析指令往往是同一个命令,这使得用户在记忆使用时相当轻松。使用时可以每次只输入一个命令(适合初学者),也可以通过一个Stata程序一次输入多个命令(适合高级用户)。这样的话,即使发生错误,也较容易识别并加以修改。
(3) 开放的框架,众多用户支持
Stata的构建哲学是建成一个开放的、用户可以添加自己编写的程序的软件。用户可以根据自己的需要编写所需统计量、估计方法等程序,同时网上有很多Stata用户编写的程序包可下载并使用。这些用户程序能够轻松解决许多复杂的计算和数据处理,而所有这些用户程序都能够以资源共享的形式从网络上轻松获得。
软件4 R语言
R语言起源于贝尔实验室的S语言,是一种为统计计算和绘图而生的语言,它是一套开源的数据分析解决方案,由一个庞大且活跃的全球性研究型社区维护。R语言可从官网https://www.r-project.org/下载。
R语言的特点可以简要归纳为以下3点:
(1) 免费开源
多数商业统计软件价格不菲,投入成千上万美元都是可能的。而R是免费的,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免费下载和使用的!这对绝大多数使用者而言,好处显而易见!它易于扩展,并为快速编程实现新方法提供了一套十分自然的语言。用户可以免费获取全球各地使用者贡献的各类“包”,并直接使用,而不必要自己重新写一套算法。目前R已经提供了超过了1万个“包”可供用户选择。
(2) 功能强大
R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统、数组运算工具(其向量、矩阵运算方面功能尤其强大)、完整连贯的统计分析工具、优秀的统计制图功能、简便而强大的编程语言、可操纵数据的输入和输出、可实现分支、循环,用户可自定义功能。因此,与其说R是一种统计软件,还不如说R是一种数学计算的环境。
(3) 优秀的绘图功能
R拥有顶尖水准的制图功能。如果希望复杂数据可视化,那么R拥有最全面且最强大的一系列可用功能。试想,仅仅一个ggplot2包就编写了好几本教材专门介绍其使用方法。
R的优点远不止上述所提,对它钟情者或许更能体会。唯一遗憾的是,R的学习曲线较为陡峭,对于新手入门较为困难。由于它免费开源的特点,许多功能都是由独立贡献者编写的可选模块,这些文档可能比较零散、很难找到,且每个用户的语法书写习惯不同,代码没有相对统一的使用定义,增加了初学者的难度。
软件5 jamovi
jamovi是一款近年来新兴的专业数据统计分析软件,由软件工程师Jonathon Love、Damian Dropmann和 Ravi Selker领衔开发,其最初开发是面向心理学的,但是随着发展也逐渐应用到其他学科中。jamovi适用于多种操作系统及应用平台,免费开源,目前已成为国外广泛使用的一款统计分析软件,其下载网址为https://www.jamovi.org/。
jamovi的特点可以简要归纳为以下4点:
(1) 免费、开源
相比许多统计软件高昂的价格,jamovi软件免费、开源,可以在多平台下载使用,是一款不用付费就能使用的正版统计软件。
(2) 友好的操作界面
jamovi的操作界面与SPSS类似,直观易懂、操作便利。使用jamovi对数据进行统计分析,只需要通过选择菜单、填写对话框和点击按钮等简单操作即可完成,免去了复杂的程序编辑环节。分析过程,不仅可以同步得到标准数字图表,还可产生美观、高清的统计图;这些结果均可便捷地导出或复制、粘贴。此外,jamovi可以实现数据的实时编辑与管理,相应的统计分析结果也会在输出窗口及时更新,极大地提高了工作效率。
(3) 灵活安装模块,避免“模块灾难”
jamovi软件具有可扩充性的特点,主菜单栏包含了常用的统计分析模块,若想实现更多的统计分析如元分析、功效分析、中介与调节模型分析、贝叶斯方法等可通过加载模块(Modules)的方式实现方法扩充,这种方式很好的规避了过多的模块使得主菜单或模块列表里过于拥挤,造成分析模块的选择和操作的不便。
(4) 集成R的庞大功能
jamovi是基于R语言开发,可以与R软件无缝对接,加载Rj模块后,可通过Rj Editor实现所有R软件的数据处理功能。
其实使用过jamovi的人就知道,该软件操作非常简单,很适合临床医护人员使用,甚至可以说是为非统计学专业人员量身定做的一款统计软件,估计该软件在国内会迅速被推广。我们也推荐非统计学专业的临床医护人员优先学习这款软件,关于jamovi的更多介绍,请阅读jamovi——一款为医护人员量身定做的数据分析软件新宠。
软件6 Python
Python是一种解释型、面向对象、适合动态数据类型的高级程序设计语言,标准库和第三库众多,功能强大,既可以运用于数据分析,也可以开发企业级应用。Python由Guido van Rossum于1989年底研发,第一个公开发行版面世于1991年。其官方网址为https://www.python.org。
Python的特点可以简要归纳为以下3点:
(1) 模块众多,功能强大
Python的模块众多,基本实现了所有的常见功能,从简单的字符串处理,到复杂的3D图形绘制,借助Python模块都可以轻松完成。Python社区发展良好,除了Python官方提供的核心模块,很多第三方机构也会参与模块开发,这其中就有Google、Facebook、Microsoft等软件巨头。即使是一些小众的功能,Python往往也有对应的开源模块,甚至不止一个模块。
(2) 使用简便,易于学习
Python对于初学者非常友好,易于理解和学习。相比于用其他大多数编程语言编写的程序,Python程序更整洁。Python几乎没有多余的符号,且使用的是简单易懂的英语名称,阅读一个良好的Python程序就感觉像是在读英语一样。Python的这种伪代码本质是它最大的优点之一,它使你能够专注于解决问题而不是去搞明白语言本身。
(3) 免费、开源
Python是FLOSS(自由/开放源码软件)之一。简单地说,你可以自由地发布这个软件的拷贝、阅读它的源代码、对它做改动、把它的一部分用于新的自由软件中。用户使用Python进行开发或者发布自己的程序,不需要支付任何费用,也不用担心版权问题,即使作为商业用途,Python也是免费的。
软件7 GraphPad Prism
GraphPad Prism是一件操作简单、功能强大的作图“神器”,为非统计学专业的使用者提供简便的作图功能。这款软件能够帮助使用者节省统计分析时间,并做出准确、更明智的分析选择,直观地展示数据。许多基础研究的科研人员对它情有独钟。其官网为:https://www.graphpad-prism.cn/。
软件8 MATLAB
MATLAB是一种用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境。该软件最早由美国新墨西哥大学教授克里夫·莫勒尔独立编写,后与杰克·李特和斯蒂夫·班格尔特合作成立了MathWorks公司,进一步发展新功能。MATLAB的一个重要特点是可扩展性,可以通过附加的工具箱(Toolbox)进行功能扩展,每一个工具箱就是实现特定功能的函数的集合。在MATLAB中,用户不但可以查看源代码,还可以可根据自己的需要进行修改以及创建自定义函数。其官网为:https://www.mathworks.com/。
软件9 Minitab
Minitab Statistical Software是一个统计套装软件,常被简称为 Minitab,由宾州州立大学的研究员Barbara F. Ryan等人研发。该软件提供一套全面一流的数据分析、预测分析和过程改进工具,具有无可比拟的强大功能和简易的可视化操作。其最新版本Minitab 18提供了包括简体中文在内的八种语言界面。可在其官网免费试用或购买:https://www.minitab.com/en-us/。
软件10 Mplus
Mplus是由Linda Muthén和Bengt Muthén开发的一个统计建模软件。该软件具有易于使用的图形界面和展示数据分析结果的模式、估计和算法。Mplus最新版本为8.6版本,可在其官网http://www.statmodel.com/进行购买,并且可以通过官方教学视频和网络笔记等进行学习。
软件11 S-PLUS
S-PLUS是由美国MathSoft公司开发的一种基于S 语言的统计学软件,现被TIBCO收购,又名TIBCO Spotfire S+。主要用于数据挖掘、统计分析和统计作图等。采用S-PLUS可以很方便编写算法,得到想要的结果,并且还强调演示图形、探索性数据分析、统计方法、开发新统计工具的计算方法,以及可扩展性,以满足统计学家及一般研究人员的研究需求。最新版本TIBCO Spotfire S+ 8.2.0可在TIBCO公司官网下载:https://edelivery.tibco.com/storefront/eval/tibco-spotfire-s-/prod10222.html。
软件12 SPSS Amos
SPSS Amos是一款强大的结构方程建模软件,支持通过扩展标准多变量分析方法(包括回归、因子分析、相关分析以及方差分析)来支持研究和理论。使用直观的图形或程序化用户界面构建态度和行为模型,与标准多变量统计方法相比,这些模型可以更准确地反映复杂关系。SPSS Amos包含在 SPSS Statistics 的高级版中,也可作为单独软件应用购买使用。其官网为:https://www.ibm.com/cn-zh/products/structural-equation-modeling-sem。
软件13 Epi Info
Epi Info是由美国疾病控制与预防中心(Centers for Disease Control and Prevention,CDC US)所开发的免费统计软件,专为全球公共卫生从业者设计,可用于用于调查取样、资料登录与后续统计分析等工作,可进行多种不同的统计分析方法。其官网为https://www.cdc.gov/epiinfo/index.html。
软件14 FineBI
FineBI是帆软软件有限公司推出的一款商业智能软件,具有数据处理、即时分析和多维度分析等功能。其官网为:https://www.finebi.com/。
软件15 Statistica
Statistica最初由StatSof开发,目前由TIBCO公司运行维护。该软件用于整合数据分析、图表绘制、数据库管理与自订应用发展系统环境,具有丰富的图形库种类,并且操作简便,适用于多学科的数据分析方法。最新版本为Statistica™ 14,其官网为:https://www.statistica.com/en/。
软件16 DAS
DAS (Drug and Statistics, or Drug Analysis System)为一种大型药理学计算软件,常用于生物统计、定量药理 、临床药理、转换医学、荟萃分析、数据管理、随机盲法等临床试验方法学研究。其官网为:https://www.drugchina.net/。该软件现已推出3.0版本可下载。
软件17 Microsoft Office Access
Microsoft Office Access是一个数据库管理系统,将数据库引擎的图形用户界面和软件开发工具结合在一起。Microsoft Office Access具有强大的数据处理、统计分析能力,并且还具有开发软件的功能,比如生产管理、销售管理、库存管理等各类企业管理软件。其官网为:https://www.microsoft.com/zh-cn/microsoft-365/access。
软件18 Microsoft Office Excel
Microsoft Office Excel是一款电子表格软件,其直观的界面、出色的计算功能和图表工具,再加上成功的市场营销,使Excel成为现在最流行的个人计算机数据处理软件之一。Microsoft Office Excel具有整理数据、以公式执行计算、以图表和图形呈现数据、预测趋势等功能。其官网为:https://www.microsoft.com/zh-cn/microsoft-365/excel。Excel的统计分析功能很强大,只是我们并未重视它而已。
其他软件
除了上述提到了常用统计分析软件以外,还存在着很多单位自主研发的一些统计分析软件,如:
- (1) BMDP (Bio Medical Data Processing),即生物医学计算程序,BMDP与SAS、SPSS并称为三大统计软件包,其第一版由加州大学洛杉矶分校统计学家Wilfrid Dixon基于一个生物医学应用软件BIMED研发,至今已有40余年历史。BMDP最初为免费软件,后由Statsols (Statistical Solutions)公司购买并发行。BMDP软件曾经是一种重要的世界级的统计工具软件,具有严格测试过的大量完备的函数系统,包括方差分析(ANOVA)、回归分析(Regression)、非参数分析(Nonparametric Analysis)、时间序列(Times Series)等,并尤为擅长进行生存分析(Survival Analysis),应用于生化、医药、农业等各种领域的统计分析。但是,BMDP软件在20世纪90年代后发展趋于停滞,Statsols公司提供的BMDP软件已于2017年起不再可用。
- (2) SASD (Package for Statistical Analysis of Stochastic Data),即随机数据统计分析程序包,该软件是由中国科学院计算中心研制,采用FORTRAN语言编写完成,比较适合从事统计专业人员使用。
- (3) SDAS (Statistical Design and Analysis System),即统计设计和分析系统,于1992年由解放军总医院医学统计教研室开发,操作方式简单,契合国内医学统计学教材,但1995年后再无新的版本。
- (4) CHISS (Chinese High Intellectualized Statistical Software)。CHISS为一款功能丰富、操作简单的中文分析软件,可用于多种科研活动。该软件由北京元义堂科技公司研制,并与解放军总医院、首都医科大学、中国中医研究院等协作完成,具有中国自主知识产权。1997年开始研发,2001年推出第一版。
- (5) NoSA,由中国人民解放军第四军医大学卫生统计学教研室夏结来教授和陈长生博士研制的中文交互式统计分析软件包。
- (6) PEMS (Package for Encyclopaedia of Medical Statistics),即《中国医学百科全书·医学统计学》统计软件包,由四川大学华西公共卫生学院卫生统计学教研室,依据杨树勤教授主编的《中国医学百科全书·医学统计学》为蓝本所研发。该软件易于操作,并有详细的说明书供学习参考,适用于各层次医务人员的临床科研数据分析。
- (7) SPML (Statistical Program for Linear Modeling)。该软件为第四军医大学卫生统计学教研室所研发的中文统计分析软件。该软件可对医院统计信息进行多种统计分析,具有用户界面友善、数据管理功能丰富等特点,便于直观、高效地进行实验设计模型拟合。
还是那句话,每款软件都有自己的特点,我们需要根据自身的需求和实际情况选择一款最适合自己的软件进行学习!欢迎大家收藏我们网站或关注微信公众号。
本文所有图片均来自于相关软件页面或官网页面。