小白学数据可视化:如何选择适合您数据的图形?
这是我的第3篇数据可视化(data visualization)的文章。
本文介绍如何选择适合您数据的图形。通过本文,可以获得:
-
常用的图形
-
如何思考和选择适合数据的图形
常用图形
在做数据可视化的时候,您使用过那些图形?(请思考)
我们打开Excel软件,选择【插入】,找到【图表】,了解一下可用的图形。
如下图:

常用图形包括但不限于:
-
柱形图
-
折线图
-
饼图
-
面积图
-
散点图
-
直方图
-
箱形图
-
条形图
-
树状图
-
气泡图
-
热力图
-
组合图
等等
上面罗列的这些图形,如何使用Excel实现?又如何使用R语言编写代码实现?(请思考)
如何思考和选择适合您数据的图形?
面对您面前的数据,如何做适合它的图形?这个问题既需要思考,也需要实验。
我们可以从两个方面思考:
第一个方面:从数据可视化的数据入手。
首先,了解一下数据的概况,知道数据的变量个数和各变量的类型
接下来,思考您的可视化是单个变量的可视化,还是双变量可视化,还是多变量的可视化。
第三,确定属于是那种可视化方式后,进一步看变量的类型。
比方说,单变量的可视化
若是单变量是离散的变量,可以绘制柱形图或者条形图
若是单变量是连续的变量,可以绘制直方图或者箱形图
若是为双变量可视化,第一个变量是离散的,第二个变量是连续的,请问适合用什么图形表示?两个变量都是连续的,请问适合用什么图形表示?(请思考)。
第二个方面:从数据可视化的目标入手。
首先,清楚数据可视化的目标,是要研究分布,还是了解关系;是查看对比,还是分析组合,不同目标,会有不同数据可视化。
接下来,根据数据可视化的目标,选择数据合适的变量,了解变量的个数和类型,此时可以借用第一个方面的思考,协助选择合适的图形。
第三,根据数据可视化的目标和数据可视化的数据,借用合适的工具(主要采用R语言)绘制图形,然后进行修饰,直到可以。
借用一幅图,来总结上面两方面的思考:

(温馨提示:点击图片,可以清晰查看)
总而言之,我们可以根据数据可视化的目标和数据来思考,确定所要绘制的图形,然后用R语言写代码实现和完善。
熟能生巧。
关于如何选择合适您数据的图形,您有什么见解,请留言。
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!