【观点】2018年用R语言做好五件事
2018年用R语言做好五件事
1 R语言开源,免费,跨平台。
2 R语言可以做数据科学工作流各个环节的任务。
3 R语言深受数据科学工作者的喜欢。
学习R语言,需要学以致用,活学活用。
博学之,审问之,慎思之,明辨之,笃行之。(《礼记》)
2018年,玩数据和用数据的朋友可以考虑用R语言做好这五件事。
事一:数据可视化
1 清楚每种图形所适合的应用场景
2 熟悉R语言ggplot2包的使用
3 思考利用可视化做探索性分析和数据结果表示
思维训练
1 折线图,条形图,散点图分别有什么作用?
2 ggplot2包画图的原理是什么?如何利用ggplot2设计和生成可以出版的高质量图片?
事二:数据处理
1 掌握数据集的导入和导出
2 熟悉数据的选择,变量的衍生,数据的聚合和连接
3 掌握数据格式的转换
4 熟悉readr包,dplyr包和tidy包的使用
思维训练
1 如何读取json格式数据和数据库的表数据?
2 如何把宽数据转换为长数据?
事三:统计分析
1 R语言是统计编程语言,适合做统计分析
2 R语言对统计学知识有着全面的实现和解读
3 熟悉描述性统计和推断性统计
思维训练
1 描述性统计和推断性统计的异同?
2 常用的统计模型有哪些?可以解决什么问题?
事四:机器学习
1 掌握经典的机器学习算法
2 掌握从小数据中学习,实现数据到商业价值的转换
3 熟悉一系列机器学习包的使用,例如:caret,e1071,gbm,randomForest,glmnet,xgboost等。
思维训练
1 机器学习算法如何选择?参数如何调整?
2 如何提高机器学习算法的精度?
3 如何做特征工程?
事五:数据自动化报告
1 掌握数据自动报告的生成和传播
2 掌握R语言做自动化报告的流程
思维训练
1 数据自动化报告的好处是什么?
您在阅读中有什么见解,请留言。
想加入数据人网R语言,请加微信:luqin360。
更多R知识,请阅读原文。
公众号推荐:
1 数据科学与人工智能,分享数据科学和人工智能的内容。
2 好又乐书屋,分享王阳明|曾国藩|毛泽东的思想,健康、教育的内容,传播正能量。
阅读原文,更多精彩!
分享是收获,传播是价值!
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!