小白学数据可视化:基于R生态的数据可视化工作环境构建
这是我的第2篇数据可视化(data visualization)领域的文章。
第1篇文章:《小白学数据可视化:前言》
本文介绍基于R生态构建数据可视化工作环境,主要是从实际工作中总结而成。
第一,安装R软件和RStudio软件。
R软件安装链接:
https://cran.r-project.org/bin/windows/base/old/
这个链接收录R软件的各种版本,推荐安装R3.5版本,太新的版本,会遇到一些R包不适应。

软件下载成功后,点击安装,其中有个步骤,让你选择安装的内容,若是你的电脑是64位机,就不要选择32位机了。
RStudio软件安装链接:
https://www.rstudio.com/products/rstudio/download/

下载成功后,点击安装。
第二,RStudio软件配置
RStudio是一个开源的,专业的,强大的服务R语言的集成开发工具。
打开RStudio后,点击菜单栏【Tools】,打开【Global Options】,做如下配置:
-
Code:找到【Saving】,把default text encoding改为UTF-8。
-
Appearance:按着下图配置。

配置好后,点击【Apply】即可。
第三,安装可视化所需的R包
这些R可视化包,是我在实际工作中经常使用的。有些数据,是规整的,可以直接用来做可视化;而有些数据,是杂乱的,需要先处理好,才能用来做可视化。
所需R包安装
1##########################
2# 小白学数据可视化R包
3# 所需R包
4# 1 pacman R包自动化管理器
5# 2 tidyverse 数据科学套件,集成了数据处理和数据可视化的包(ggplot2)
6# 3 plotly 动态交互式可视化
7#########################
8
9library(pacman)
10p_load(tidyverse, plotly) # 加载R包(安装了就直接加载;没有安装的就先安装,然后再加载)
后续若是还用到其它与可视化相关的包,再继续完善。
第四,简单测试
ggplot2包,画一个直线图。
1# ggplot2包绘制直线图
2p_load(gapminder) # 加载gapminder包,使用gapminder数据集
3data(gapminder, package="gapminder")
4plot.data <- gapminder %>%
5 filter(country == 'China') # 获取中国的数据
6ggplot(plot.data, aes(x = year, y = lifeExp)) +
7 geom_line() # 绘制year与lifeExp的直线图

plotly包,画一个散点图。
1p <- plot_ly(data = plot.data, x = ~year, y = ~lifeExp,
2 marker = list(size = 10,
3 color = 'rgba(255, 182, 193, .9)',
4 line = list(color = 'rgba(152, 0, 0, .8)',
5 width = 2))) %>%
6 layout(title = 'Styled Scatter',
7 yaxis = list(zeroline = FALSE),
8 xaxis = list(zeroline = FALSE))
9p

经过测试,ggplot2包和plotly包是可以正常使用了。接下来,就可以根据实际的数据和具体的问题,来实现数据可视化,让数据讲故事了。
您有什么见解,请留言。
公众号推荐:
1 ChiefdataLab
珠海市岭南大数据研究院(现在诚聘各类数据和AI人才,有意向者,请添加我的微信:luqin360,大家一起来做些有意思的项目和产品)是一家以高端人才引进培养、前沿技术研究及产业孵化为宗旨的新型研究机构。研究院更多了解,请识别下面二维码。
2 数据人才
数据人才助手,一个帮助数据人才找工作,帮助数据公司招人才的公众号,也分享数据人学习和生活的有趣事情。
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!