关键词:R语言; R软件; R软件的优点
一、R简介
R是一种为统计计算和绘图而生的语言和环境。它是一个用于统计计算和统计制图的优秀工具,是一个自由、免费、源代码开放的软件,拥有一套开源的数据分析解决方案,由一个庞大且活跃的全球性研究型社区维护。R是诞生于1980年左右的S语言的一个分支,由“R开发核心团队”负责开发,可以看作贝尔实验室开发的S语言的一种实现。两者在程序语法上可以说是几乎一样,可能只是在函数方面有细微差别,两个软件的程序可以很容易地移植。
二、R的特点
(一)免费开源
R的获取是免费的,其源代码是公开的。可以在它的网站及其镜像中下载任何有关的安装程序、源代码、程序包及其源代码、文档资料。标准的安装文件自身就带有许多模块和内嵌统计函数,安装好后可以直接实现许多常用的统计功能。
(二)统计方法齐全
R是一个全面的统计研究平台,提供了各式各样的数据分析技术。几乎任何类型的数据分析工作皆可在R中完成。一些常用、基本的程序包已经被收入了标准安装文件中,随着新的统计分析方法的出现,标准安装文件中所包含的程序包也随着版本的更新而不断变化。另外,在标准安装文件中,已经包含的程序包有:base—R的基础模块、mle—极大似然估计模块、ts—时间序列分析模块、mva—多元统计分析模块、survival—生存分析模块等等。
(三)更新速度快
R是一种可编程的语言。作为一个开放的统计编程环境,语法通俗易懂,很容易学会和掌握。而且学会之后,用户可以编制自己的函数来扩展现有的语言。这也就是为什么它的更新速度比一般统计软件,如SPSS、SAS等快得多。大多数最新的统计方法和技术都可以在R中直接实现。R的用户群体庞大,众多新算法会首先应用在R中。因此,R囊括了许多在其他软件中尚不可用的、先进的统计方法。
(四)良好的互动性和优秀的作图能力
R具有很强的互动性。除了图形输出是在另外的窗口处,代码的输入和结果的输出都是在同一个窗口进行的,输入语法中如果出现错误会马上在窗口中得到提示;对历史命令有记忆功能,可以随时再现、编辑修改以满足用户的需要。R拥有顶尖水准的绘图功能,可以实现复杂数据的可视化,包括源数据的统计描述图、回归结果的森林图、模型评价的ROC曲线等可视化图形(如图1)。输出的图形可以直接保存为JPG、BMP、PNG等图片格式,还可以直接保存为PDF文件。另外,与其他编程语言和数据库之间有很好的接口。
(五)多平台兼容
R可运行于多种平台之上,包括Windows、Mac OS、Linux等(图2)。
(六)良好的拓展性
R的功能可被整合进其他语言编写的应用程序,包括C++、Java、Python、PHP、Pentaho、SAS和SPSS。