Tableau与R语言集成以实现更强大分析功能
这是第二篇关于Tableau文章。第一篇文章请点击《认识Tableau》。
本文会介绍到这些内容:
1 R语言简介
2 Tableau与R语言集成的实现
3 Tableau与R语言协同以实现更强大的数据分析
【需要加入数据人圈子,请添加微信:luqin360】
R语言简介
R语言是由两位统计学家设计的开源语言和软件,赢得了许多数据工作者(数据分析师,统计工作者,数据科学家等)的大力支持。它被很多人使用,也有很多人在为之做贡献。它有着非常多地R包,可以解决各式各样的问题。它擅长做统计分析和数据可视化的工作,同时,它也能够完成数据科学工作流中各个环节里面的事情,比方说,数据获取,数据探索,数据分析,数据建模,数据结构沟通等。总之,R语言是数据人工作和生活的得力助手。
Tableau与R语言集成的实现
Tableau与R语言如何集成呢?操作步骤如下:
-
第一步:安装和运行Rserve,启动RServer进程。
RServer基于TCP/IP协议,允许R语言与其它编程语言通信的程序包。
安装和运行Rserve的代码
library(pacman) # R包管理器
p_load(Rserve) # 检测RServe是否安装,若是安装了就加载;若是没有安装,就先安装成功后,再加载
Rserve() # 启动RServe进程
结果如下:

-
第二步:Tableau配置Rserve连接
1)打开Tableau软件,点击【帮助】菜单,选择【设置和性能】,点击【管理外部服务连接】,如下图:
2)点击测试连接,连接成功会显示如下结果 -
第三步:Tableau使用R脚本编写方式
利用Tableau提供的4种R脚本表计算函数实现Tableau的数据传递给R引擎,R引擎完成计算和分析把结果回传给Tableau使用。
4中R脚本表计算函数如下:
1)SCRIPT_BOOL:返回R脚本的布尔结果
2)SCRIPT_INT:返回R脚本的整数结果
3)SCRIPT_REAL:返回R脚本的实数结果
4)SCRIPT_STR:返回R脚本的字符串结果
脚本表计算函数的编写的语法,以SCRIPT_INT为例:
SCRIPT_INT(‘R语言脚本(含参数)’, Tableau传入参数1,参数2,….)
R脚本针对Tableau传入的参数做聚类分析,编写如下:
SCRIPT_INT('result <- kmeans(data.frame(.arg1, .arg2, .arg3));result$cluster;', SUM([A]), SUM([B]), sum([C]))
R引擎会按着下面代码执行,并且把结果回传给Tableau。
result <- kmeans(data.frame(SUM([A]), SUM([B]), SUM([C])))
result$cluster
Tableau与R语言协同以实现更强大的数据分析
目标:利用R语言做聚类分析;利用Tableau把分析结果做可视化呈现
聚类分析是“物以类聚,人以群分”的哲理思想的体现,基于距离度量来解决相似和相异的问题。
数据集:使用UCI的iris数据集。数据集下载链接:
http://archive.ics.uci.edu/ml/datasets/iris
具体操作和脚本编写,描述如下:
第一步:打开Tableau 10.5 软件,连接目标数据集-iris数据集
iris数据集OverView,如图:

第二步:在工作表的度量窗口创建计算字段,聚类类别
【聚类类别】脚本
SCRIPT_INT('
result <- kmeans(data.frame(.arg1, .arg2, .arg3, .arg4), 3);
result$cluster;
',
SUM([萼片长度]),
SUM([萼片宽度]),
SUM([花瓣长度]),
SUM([花瓣宽度]))
如图:

聚类类别结果后数据可视化,如图

请思考两个问题:
-
1 如何比较聚类的效果?
-
2 如何在Tableau中利用R语言的决策树模型做预测分析?
本文简要介绍了Tableau和R语言集成以实现更加强大的分析功能,在使用的时候,我们要清楚各种工具的优势和擅长点,我们要努力地做到发挥各自的优势,从而实现“1 + 1 >> 2”的效能。
如果文章对您有用,请点赞,并且分享给您的朋友或者同事。
您任何问题或者想法,请留言和评论。
我们创建数据人网http://shujuren.org,它是数据人的家园,一个数据人学习,交流和分享的场所。欢迎您,大家一起来创造和分享数据知识,共建和共享数据智库,为智能化社会助力。
内容推荐
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!