R语言学习:速读《Data Science for Business with R》书籍
2022年第09周。
R语言学习,这一周记录如下。
本周,我速读了《Data Science for Business with R》书籍。
我先看了目录,简要内容结构如下。
01
Data Science for Business with R 由 Jeffrey S. Saltz 和 Jeffrey M. Stanton 撰写,作者提供了一个使用全球航空公司客户调查数据集的案例,以说明如何将数据转化为业务决策,此外还有大量示例。这本书使用免费的R和RStudio软件,它可是最流行的数据科学工具之一。 本书章节遵循从介绍和安装 R 和 RStudio、使用数据架构、进行数据收集、执行数据分析以及过渡到数据归档和演示。每章内容组织结构类似,首先从学习目标和背景开始,然后介绍函数的使用和简单的示例,将这些函数应用于案例研究,最后以章节挑战问题、资源和 R 函数列表结束。Data Science for Business with R为读者提供了数据科学领域的简单实用的指南。
02
做数据科学所需技能?这本书回答了这个问题。
1)学习应用领域
2)与数据用户沟通
3)看清复杂系统的大局
4)知道如何表示数据
5)数据变换与分析
6)数据可视化与演示
7)重视数据质量
8)数据伦理
关于这八点,详细的解读,大家可以看这本书。同时,你也可以思考下这个问题:做数据科学所需技能?总体来说,我还是很赞同作者提及的这八点,在此基础上面,我补充三点。
1)团队合作,他人力量
2)编程技能,高效工作
3)解决问题,创造价值
03
如何识别数据问题?
通常,一切有价值的事情,都与一个个有价值的问题有关系。
原则:需要开放性、好奇心、创造力和提出大量问题的意愿。
这本书分享了三点策略。
1)与SME(领域专家或者专业人士)互动并让该人讲述相关情况的故事
2)寻找异常情况,包括好的和坏的
3)找出风险和不确定性
关于原则和策略的更多内容,还是请你阅读这本书。同时,你也可以思考下这些问题。
1)如何识别数据问题?
2)如何利用数据解决你感兴趣的问题?
3)你所感兴趣的问题可以带来那些价值?
4)如何正确定义你感兴趣的问题?以及问题的正确性?如何正确解决问题?
这本书,我重点关注<<Introduction: Data Science, Many Skills>>这部分内容。数据科学是什么,数据科学的步骤,数据科学所需技能,数据问题的识别等,在这里都有介绍。后面的章节内容,就是R语言、函数、实例和应用结合起来,以有序推进数据科学工作流程各个环节所要做的事情。
需要看这本书的朋友,请给R语言公众号发送消息:20220226。
我也创建R语言群,你可以添加我微信,我邀请你进群,一起学习。
如果你想学习数据科学与人工智能,请关注下方公众号~
2021年R语言学习专辑:
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!