【数据人课堂】数据分析 101
关键词:数据库,数据分析,R 语言,数据应用,统计建模
主讲:李悦
2016. 07
数据人课堂 -数据科学系列(基础班)
课程介绍
大数据、云计算、数据科学,机器学习,这些热门词汇充斥着今天的职场,不论你是学习数据科学的学生,还是蠢蠢欲动梦想职场转型的白领,学习数据分析的知识都会帮助你更好的理解身边无处不在的各种数据。随着科技的更新,技术的进步,数据的价值被挖掘利用,并广泛应用到商业、医学、农业等重要的领域,学习基本的数据分析技能其实并非像我们想象的那样遥不可及,只要你有一颗永不言弃,活到老,学到老的心,借助电脑,借助网络,我们可以携手踏上丰富职场技能的旅程!
基础班学员对象
在校学生(专业不限) |
|
欲求职场转型的白领 |
培养目标
在各种职业技能和招聘相关的网站上,数据分析经常位居榜首,这不仅仅是大数据时代下的产物,更因为数据分析是一种结合了多门学科,需要专业知识和实践经验的具体技能,就像一门专门的语言,我们需要不断学习和巩固来增强自己从数据中掘取信息的能力。
本课程以网络授课为依托,通过分析现实中的数据来充分理解理论概念,灵活运用统计软件,锻炼学员解决实际问题和独立研究的能力。各种数据分析,统计的教材不胜枚举,但实际的案例分析让我们融会贯通,将所学举一反三,培养学员独立解决数据问题的实际技能。
课程准备
初级、中级 R 语言和R Studio 熟悉程度,基本统计知识,数据人网站文章的阅读和理解(具体安排详见讲师邮件,每周课前邮件介绍课程准备和上课内容预览)
课程内容
1. 统计基础知识 & R/RStudio setup & R 数据类型介绍
a. 第一周
2. R +数据库=非常完美
a. 第二周:R 简单命令(如 gsub,grep,循环While / For Loop 命令 & apply / lapply / sapply /tapply / vapply 命令) & SQL 数据库语言介绍
b. 第三周:dplyr 包 & data.table包 & 数据可视化 ggplot 包
3. 金融信用风险建模之 R 实战案例
a. 第四周:银行贷款的信用违约和数据介绍& 异常值,缺失值侦查与处理,利用现实中的数据理解上一周所学理论,如理解并灵活运用直方图,加深对数据深入理解,为之后建立模型做前期准备
b. 第五周:基本分析方法介绍,如分类法Logistic Regression, RandomForest, 以及 Bagging & Cross Validation & Confusion Matrix 的使用, TN / TP / FP / FN 等统计概念的介绍
4. 处理缺失值的常规方法总结
a. 第六周:MICE 包 & VIM 包介绍 & 核心命令演示讲解,学习如何理解命令的输出结果
b. 第七周:对不同数据类型运用不同处理方法 & 箱线图,点图,密度图等视觉作图类型介绍 & ggvis 包介绍
5. 课程复习总结
a. 第八周:课程实战项目联系,展示 & 课程项目反馈 & 答疑
课程安排
1. 每周滚动开课
2. 课程每周一课,历时两个月,八周
3. 每周一期学员,小班授课(8到12人)
课程练习
1. 每两周课程结束后安排一次练习
2. 下一周开课时讲解答案和答疑
3. 最后一周安排课程案例项目分析
练习互动
评分 |
自我测评 |
学员间测评 |
练习二 |
||
练习三 |
课程案例介绍
日前进行的如火如荼的美国选举似乎只是文字上的政治游戏,但其实希拉里的竞选团队却有着相当数量的数据分析师在不断分析着各种选举数据,为拉选票的活动提供有价值,有针对性的举措,比如通过选民户口,教育水平,家庭收入,历史选举记录,家庭住址,选区种族构成比例等等数字,非数字的数据类型来提前预测支持率和选举结果,这种数据集还有着缺失值等现实中常见的情况,通过建立不同模型,我们可以实战学习如何通过数据建模和数据视觉化来体验政治数据分析师的工作,丰富应对不同数据类型的经验,理论结合实际是最好的老师。
课程案例反馈
课程案例区别于小练习,力求让学员灵活运用所有课程所学的方法设计数据分析实例,包括数据分析问题设计,数据选择,数据整理,数据视图和数据建模等模块
1. 学员自我测评
2. 学员间互动测评
3. 讲师反馈 & 答疑
课程价格
项目 |
费用(元) |
说明 |
R语言数据分析基础班 |
2999 |
学时:8 周,理论基础 7 周 + 实战案例 1 周 |
课程优惠
1) 7 月 15日之前报名可享九折优惠
2) 3 人以上可享九折优惠
开课时间
提前一周通知
咨询方式
电话:13532804605
微信: luqin360
讲师介绍
李悦
纽约大学硕士毕业,专业金融传媒,就职于纽约卖方投资研究机构,数据分析师,特许金融分析师(CFA),曾作为演讲嘉宾参加江西财经大学举办的金融大数据学术会议,硕士论文发表于New York State Communication Association 学术期刊
《R+数据库=非常完美》
《金融信用风险建模之R实战案例》
陆勤
深圳大学硕士毕业,专业智能信息处理,就职于深圳一家互联网金融公司,数据挖掘师,数据人网发起人。
数据人网是数据人学习、交流和分享的平台http://shujuren.org 。专注于从数据中学习。
平台的理念:人人投稿,知识共享;人人分析,洞见驱动;智慧聚合,普惠人人。
您在数据人网平台,可以1)学习数据知识;2)创建数据博客;3)认识数据朋友;4)寻找数据工作;5)其它与数据相关的干货。
我们坚持做原创!!
我们都是数据人,数据是有价值的,坚定不移地利用数据价值创造价值!
数据资料、数据课程、数据圈子、数据工作和数据项目服务,请加微信:
luqin360
数据人网官方公众号:数据科学自媒体,分享和传播数据科学领域的干货。
点击【阅读原文】,体验【数据人网】
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!