R语言玩数据:流程和环境
摘要:介绍玩数据的流程和搭建R语言工作环境。
文章《R语言玩数据:R语言和数据》介绍了R语言是什么?数据是什么?为什么用R语言玩数据?等基本问题,本文总结玩数据的流程,介绍R语言玩数据的工作环境构建。
玩数据流程
做任何事情都有相对应的方法论,玩数据也不例外。
IBM的CRISP-DM可以作为玩数据的流程,如图:
-
业务理解:清楚业务问题和目标
-
数据理解:深入了解用于数据分析和挖掘的数据
-
数据准备:对待挖掘数据进行合并,汇总,排序,样本选取等操作
-
建立模型:根据前期准备的数据选取合适的模型
-
模型评估:使用在商业理解阶段设立的业务成功标准对模型进行评估
-
结果部署:使用挖掘后的结果提升业务的过程
玩数据的工作环境
选择R语言玩数据,首先要安装R软件,它是一款开源软件,根据自己的操作系统和机器的位数,下载和安装相应的软件。
R软件下载网址:http://r-project.org
首页如下图
点击红色矩形框,进入R软件下载页面
R软件安装成功后,启动软件,如下图
R控制台显示了一些告知信息,包括R的版本,R的简介,R几个常用函数的作用。
安装好R软件后,推荐安装R的集成开发工具RStudio软件。
RStudio软件的下载网址:https://www.rstudio.com/products/rstudio/download/
如下图
点击红色矩形框,下载RStudio软件
RStudio软件安装成功后,启动软件,如下图
上面的软件界面做了如下设置
说明:先安装R软件,后安装RStudio软件
R软件和RStudio软件安装好后,玩数据的环境也就搭建好了,后续就可以利用这个工作环境用R语言玩数据了。
参考资料:
1 R官网 http://r-project.org
2 RStudio官网 http://rstudio.com
3 使用IBM SPSSModeler 进行数据挖掘之数据理解 https://www.ibm.com/developerworks/cn/data/library/techarticle/dm-1209xuep/
您在阅读中,有什么建议或者想法,请留言,也可以加微信luqin360交流。
数据人网是数据人学习、交流和分享的平台http://shujuren.org 。专注于从数据中学习到有用知识。
平台的理念:人人投稿,知识共享;人人分析,洞见驱动;智慧聚合,普惠人人。
您在数据人网平台,可以1)学习数据知识;2)创建数据博客;3)认识数据朋友;4)寻找数据工作;5)找到其它与数据相关的干货。
我们努力坚持做原创,聚合和分享省时有用的数据知识!
我们都是数据人,数据是有价值的,坚定不移地实现从数据到商业价值的转换!
您在阅读中有什么想法或者意见,请留言或者加微信:luqin360进一步交流。
为什么做数据人网http://shujuren.org
帮助人们做明智决策,令人兴奋和有价值!
怎么做数据人网http://shujuren.org
把数据驱动决策做到极致,涵盖数据思维和数据技术等!
数据人网做什么?
数据人网是数据知识服务商!
共建共享优质数据知识库,提供省时有用数据知识。
数据人网诚邀有缘人,一起做这个事情。现在急需要一位前端设计和开发工程师,需要许多数据知识分享者!(微信:luqin360)
点击“阅读原文”进入数据人网。
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!