一个数据人的2019
专题介绍:R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用户的界面体验更好)。也正是由于全世界越来越多的数据科学社区和用户对R包的慷慨贡献,让R语言在全球范围内越来越流行。其中一些R包,例如MASS,SparkR, ggplot2,使数据操作,可视化和计算功能越来越强大。R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。R作为一种统计分析软件,是集统计分析与图形显示于一体的。它可以运行于UNIX、Windows和Macintosh的操作系统上,而且嵌入了一个非常方便实用的帮助系统,相比于其他统计分析软件,R的学术性开发比较早,适合生物学和医学等学术学科的科研人员使用。
预测未来最好的方法,就是去创造未来。by 彼得·德鲁克
2019年上半年,我在一家金融科技公司做着基于问题和数据驱动的风控模型和标签体系的事情。具体的内容包括1)贷款产品的信用评分模型设计和实现,以及模型评估,部署和监控;2)贷款用户风险标签体系的加工、整理,固化和完善;3)风控数据的解析和结构化处理;4)风控技术文档的总结和知识的管理,等等。
2019年下半年,我在一家研究院做着基于大数据驱动的科研项目管理的工作。具体的内容包括1)基于研究院独有的数据资源,进行数据分析报告的需求文档设计,并带领团队完成数据报告;2)参与各种与大数据相关的项目申报工作;3)设计项目申报书里面的研究方法,研究技术路线和项目的特色与创新点;4)对接粤港澳大湾区各大高校和科研机构,以推进科研交流与合作,等等。
总之,我所做的事情,都与数据有着紧密关系,努力而积极地做着利用数据完成任务和解决问题以创造价值的事情。我在从事数据工作的数年里,总结了“问题-数据-特征-模型-价值”这样的一个具有着持续迭代和优化的闭环模式。简称为,“PDFMV”。我们不管身处哪个行业,但凡想利用数据创造价值,想使用数据完成变现。“PDFMV”这样的闭环都值得从上到下的数据人士做深入地思考和践行。
-
您所要解决的问题是什么?为什么要解决这个问题?是否有必要使用数据的思维和方法来驱动和解答?
-
您所解决的问题具有数据支撑吗?这些数据分布在哪里?这些数据能否获取到?这些数据质量怎么样?
-
为了解决好问题,对数据如何做特征化?(最佳地描述)
-
针对实际的问题和数据集,选择和使用什么样的模型?模型的性能和效果怎么样?模型的部署和实施如何实现?模型的后续监控如何进行?模型的迭代和优化如何推进?
-
针对模型的结果,如何指导行动?做出决策?以创造价值。
2019年,各种经历和体验,都促进了我的学习。
首先,每日的正常工作,就是一种最好的学习方式。从工作的实践中学习和提升,又反作用于工作。做好工作,就是一种良性的增进与修行。
其次,我继续坚持着写点东西。围绕数据这个主题,总结和分享了一系列文章,发布到我运营的公众号,包括R语言,数据科学与人工智能,数据人才和数据思践。
第三,2019年9月份以后,我晚上又开始回炉大学校园做进修,我申请了计算机技术及应用的专业,研究的方向包括特征选择,机器学习,深度学习以及应用。我聆听导师的建议,选择所关注领域的顶级会议或者期刊的论文(ICML,NISP,AAAI等)进行阅读和学习,并在他人研究的基础上做一些新的尝试和工作。
最后,2019年读了一些有意思的书籍,包括《富兰克林自传》,《活法》,《活好:我这样活到105岁》,《Python数据科学:技术详解与商业实践》,《数据科学(R语言)》,《定位》与《人生定位》等。每一本书,都让我有收获。感谢作者们的分享和付出。2019年也认识了一些良师益友,感谢他们的帮助和教诲。
2019年,生活方面,平平淡淡就是真。
父母身体健康,帮忙照顾小孩,辛苦他们了。
老婆做着英语教育相关的事情,我始终觉得她很优秀。
女儿在不知不觉地健康成长着,我问她,“您是我的什么?”,她说,“我是您的心肝肝”。每次周末回家,就想抱抱女儿。每次陪着女儿看书,每次陪着女儿玩游戏,每次听着女儿在面前说话,看着女儿自由自在玩耍,一种幸福感会油然而生。
于我而言,家里的老人能够健康长寿,家里的小孩能够健康快乐,家里的年轻人能够健康能干,就是最好的心愿和盼望。
2019年,全家人的身体还算健康。健康就是最大的福分。
2019年,我锻炼身体的有效频次大大下降了。虽说大部分每天都有1万多步的步行,但是,缺乏做一些适合自身身体状况的运动和调理。关于身体健康的问题,需要格外注重和在意。做一个健康的人,这是一辈子的事情。我想,从各方面来做这个健康的事业,不仅要吃得健康,还要想的健康,做的健康,最终就是要活得健康。
健康是1,其它都是0,没有了这个1,再多的0,也是没有作用的。所以,对于自己,还是家人,大家都要身体健康。
今天是2019年12月31日,2019年的最后一天。我在2018年的这天,写下了《一个数据人的2018》。开篇之语,我引用了王阳明先生关于知行合一的哲理。
时至今日,我想说几句。
第一句,岁月珍重。俗话说,岁月不饶人。言外之意,流逝的岁月一去不复返;弦外之音,当下的岁月唯有用极致。
第二句,价值投资。不要担心你被他人利用,不用顾虑你的分享被他人使用,你所需要追随的就是去做创造价值的事情。于人于己,于国于家,做一个价值贡献者。
第三句,上善若水。像水一样,做善良的事情,做与人无争的事情,做回归大海的事情,做滋润万物的事情。
第四句,时常感谢。活着在世,有着太多地感谢。每日从感谢开始,又从感谢结束,有始有终,至始至终。
我是王路情,一个数据人,专注于从从数据中学习。
关于2019年,若是您有什么想和我分享与交流的,请加我的微信:luqin360。备注:实名+工作或者专业,否则不会通过。

现在我提出四个问题,叫作“每天四问”:
第一问:我的身体有没有进步?
第二问:我的学问有没有进步?
第三问:我的工作有没有进步?
第四问:我的道德有没有进步?
——陶行知


文章推荐

请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!