数据科学实战
专题介绍:R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用户的界面体验更好)。也正是由于全世界越来越多的数据科学社区和用户对R包的慷慨贡献,让R语言在全球范围内越来越流行。其中一些R包,例如MASS,SparkR, ggplot2,使数据操作,可视化和计算功能越来越强大。R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。R作为一种统计分析软件,是集统计分析与图形显示于一体的。它可以运行于UNIX、Windows和Macintosh的操作系统上,而且嵌入了一个非常方便实用的帮助系统,相比于其他统计分析软件,R的学术性开发比较早,适合生物学和医学等学术学科的科研人员使用。
【R语言】已开通R语言社群,五湖四海,天南地北,各行各业,有缘相聚,共享R事,雕刻数据,求解问题,以创价值。喜乐入群者,请加微信号luqin360,或扫描文末二维码,添加为好友,同时附上R-入群。有朋自远方来,不亦乐乎,并诚邀入群,以达相互学习和进步之美好心愿。
《数据科学实战》这本书,我先是读了英文版电子书,后来国内有了翻译版,如下所示:
我又购买了纸质版。加上英文版和中文版的阅读,快有3遍了。
我分享一下阅读这本书的一些收获吧。
第一,这本书关于数据科学这个命题,讲解的较为详细和透彻。包括数据科学是什么?为什么?数据科学的工作流程?学术界和工业界怎么看待数据科学?数据科学的知识体系?数据科学的一些应用场景?这些内容,可以让读者对数据科学有个全面的认知,同时,能够感受到数据科学的实用性和价值所在。
第二,这本书的第三章,介绍了3个基本算法,分别是线性回归,K近邻和K均值,你在阅读的时候,可以先测试下,看是否理解了这个3个基础算法,包括算法的概念、原理、方法和应用等。
第三,后续的章节,介绍了一系列数据科学相关的应用场景,涉及到文本数据、时间序列数据、结构化数据、社交网络数据,涵盖了计算广告学、金融学、社会学、数据新闻学、社交网络等领域,使用了分类算法、推荐算法、时间序列算法等算法,采用了R语言或者Python语言来设计和实现基于算法解决问题的代码片段。
第四,这本书,还谈及了如何成为一名有道德感的数据科学家这个职业生涯问题,给予了一些合适的建议。
这是一本可以让你有启发的书籍,一本让你对数据科学有更全面而系统认识的书籍。
如果需要看电子版的,请识别下方二维码,回复数字“20201210”,获取数据科学实战电子书!
你在阅读这本书的过程中,遇到什么问题,或者有什么心得与收获,可以扫描我的微信号,备注“R-入群”。我会邀请你加入R语言群,和大家一起讨论与学习。
推荐阅读:
推荐公众号:数据科学与人工智能
数据科学与人工智能公众号推广Python语言,数据科学与人工智能的知识和信息。扫码下方二维码关注我,一起学习Python语言和数据科学与人工智能。
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!