PDFMV框架
专题介绍:R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用户的界面体验更好)。也正是由于全世界越来越多的数据科学社区和用户对R包的慷慨贡献,让R语言在全球范围内越来越流行。其中一些R包,例如MASS,SparkR, ggplot2,使数据操作,可视化和计算功能越来越强大。R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。R作为一种统计分析软件,是集统计分析与图形显示于一体的。它可以运行于UNIX、Windows和Macintosh的操作系统上,而且嵌入了一个非常方便实用的帮助系统,相比于其他统计分析软件,R的学术性开发比较早,适合生物学和医学等学术学科的科研人员使用。
导读
这是我的第47篇原创文章,关于PDFMV框架。
阅读完本文,你可以知道:
1 PDFMV框架是什么?
2 PDFMV框架有什么用途?
我从事数据工作数年,阅读数据相关的书籍数本,我一直思考着两个问题:
-
如何发掘数据洞见?
-
如何创造数据价值?
逐渐地,我总结和提炼出PDFMV框架,“Problem-Data-Feature-Model-Value”的简称,并且在数据项目积极地尝试和实践,进一步深化对这个框架的认识,强化对这个框架践行。
PDFMV是问题-数据-特征-模型-价值5个英文字母的首字母的组合。它是以问题为导向和数据为驱动,利用特征和模型从数据中学习到知识以创造价值的系统化的过程。这个过程具有3个显著特性。
-
具有闭环性。它始于有价值的问题,终于有价值的应用,基于这种环路不断地上升和进阶。
-
具有迭代性。它所包含的环节在彼此与间隙之间相互作用,反馈和影响,处于一种不断迭代和动态前进的行程中。比方说,有价值的问题指导数据的采集和加工,而数据的采集和加工又深化问题的认知和理解。
-
具有优化性。它的闭环和迭代特性,也决定了这个框架是做着不断变好和趋优的事情,并且是一种可持续性过程。
通过了解,学习和践行PDFMV框架,可以带来这些用途。
-
首先,它是有效开展数据工作的系统性方法论,让你全面地认识和执行你所从事的数据工作。不管你在数据工作这个链条里面担当什么角色,承担什么责任,在PDFMV的帮助和指引下,你不仅知道自己在做什么,也清楚你的上下游在做什么;你不仅可以确定自己的目标,也可以学习他人或者其他组织的优势。总之,你会形成和构建一个全局观和系统观。
-
其次,它可以与各行各业进行融合与衔接,不管你是从事智慧金融,还是数字水务;不管你研究数字健康,还是智慧城市;不管你是洞察社交关系,还是电子商务等等,都可以基于你所在行业进行PDFMV框架的实施与实践。总之,这个框架具有强大的可迁移性和可操作性。
-
第三,它可以逐渐地让你形成一种数据价值的思维观念,让你对利用数据创造价值的事情足够关注和重视。不管你身处什么位置,这种数据思维,是有必要的,也是非常有益处的。换而言之,任何数据项目都应该要创造价值,这是初心,也是使命。
关于PDFMV框架,您有什么想法请留言。
需要深入交流和沟通,请加我的微信:luqin360。备注:实名+工作或者专业,否则不会通过。
数据思考与践行
文章推荐

请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!