XML包导入和处理XML数据格式|R包
什么是XML?
• XML 指可扩展标记语言(EXtensible Markup Language)
• XML 是一种标记语言,很类似 HTML
• XML 的设计宗旨是传输数据,而非显示数据
• XML 标签没有被预定义。您需要自行定义标签。
• XML 被设计为具有自我描述性。
• XML 是 W3C 的推荐标准
关于XML更详细的介绍,参见链接:http://www.w3school.com.cn/xml/xml_intro.asp
R语言如何解析XML?
R语言提供了XML包解析XML数据格式,包括导入XML数据和处理XML数据,举例说明如下。
## 加载XML包
library('XML')
## 自定义一个XML数据内容
content <-
'<note>
<name>shujuren</name>
<url>http://shujuren.org</url>
<date>2016-01-01</date>
</note>'
doc <- xmlParse(content, encoding="UTF-8")
xmlToList(doc)
# use an R-level node representation
doc1 <- xmlTreeParse(content)
xmlToList(doc1)
## 转换成DataFrame类型
xmlToDataFrame(doc)
数据框的结果如下:
text
1 shujuren
2 http://shujuren.org
3 2016-01-01
思考:
手机上面的通讯录可以导成XML数据格式,如何用R语言的XML进行导入和处理?
参考链接:
http://www.cnblogs.com/shangfr/p/5564167.html
数据人网是数据人学习、交流和分享的平台http://shujuren.org 。专注于从数据中学习。
平台的理念:人人投稿,知识共享;人人分析,洞见驱动;智慧聚合,普惠人人。
您在数据人网平台,可以1)学习数据知识;2)创建数据博客;3)认识数据朋友;4)寻找数据工作;5)其它与数据相关的干货。
我们努力坚持做原创,分享和传播数据知识干货!
我们都是数据人,数据是有价值的,坚定不移地利用数据价值创造价值!
数据资料、数据课程、数据圈子、数据工作和数据项目服务,请加微信:
luqin360
点击【阅读原文】,进入【数据人网】
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!