• 主页
  • 课程

    关于课程

    • 课程归档
    • 成为一名讲师
    • 讲师信息
    教学以及管理操作教程

    教学以及管理操作教程

    ¥1,000.00 ¥100.00
    阅读更多
  • 特色
    • 展示
    • 关于我们
    • 问答
  • 事件
  • 个性化
  • 博客
  • 联系
  • 站点资源
    有任何问题吗?
    (00) 123 456 789
    weinfoadmin@weinformatics.cn
    注册登录
    恒诺新知
    • 主页
    • 课程

      关于课程

      • 课程归档
      • 成为一名讲师
      • 讲师信息
      教学以及管理操作教程

      教学以及管理操作教程

      ¥1,000.00 ¥100.00
      阅读更多
    • 特色
      • 展示
      • 关于我们
      • 问答
    • 事件
    • 个性化
    • 博客
    • 联系
    • 站点资源

      生信星球

      • 首页
      • 博客
      • 生信星球
      • R与进化树(前言)

      R与进化树(前言)

      • 发布者 weinfoeditor
      • 分类 生信星球
      • 日期 2018年7月10日
      测试开头

      今天是生信星球陪你的第61天


         你想找辆共享单车,发现满街都是别家车,没有一辆你能骑。

         你想学点生信,搜了“初学者教程”,满眼尽是高大上,没有一句能看懂。

         终于你跨越茫茫宇宙,来到生信星球,发现了初学者的新大陆!


      今晚听了Y叔之前的学术分享视频R与ggtree,想和你分享

      1. problems and issues

      • 进化领域中树这个文件结构是比较复杂的,构建树的过程就是把数据关联到文件格式中便于可视化的过程,这种关联格式主要有:

      • 标准格式之一 newick

      • 标准格式之二 nexus:软件间兼容性不好

      • 其他一些不兼容格式

        R与进化树(前言)
      • 如果只是想推断一棵树,大多数只用mega。但是现在的研究会获得大量的数据(phenotypic data/ experimental data/ clinical data/ analysis data),而且是异质性的,比如采样时间、地点,表型的观察值,实验测量数据等都是可以拿来分析有没有进化上的一些关系,mega远远不够用!但是上面的数据关联格式又不友好~

      • 树的注释:

        Figtree,TreeDyn, iTOL etc 这些软件之间也是需要互相写脚本转换格式

      • restricted to pre-defined annotating utilities

      • focus on specific analyses and data types

      • non-overlapping features and hard to customise

      2. R与ggtree

      ggtree优势:

      • 他的设计就是针对不同来源的数据,拿来可以直接注释

      • 支持高水平图形语法进行树的注释:比如有一个分类数据,要根据这个对进化树上色,并且不同节点以不同形状变现出来。指定一个变量,ggtree就会做完所有的事情

      • 支持多个图层组合,可以画出很复杂的图

      • 可以提供用户的私人订制

      • 作为R包,能够保证可重复性,自动化,利于同行的交流

      为什么要写代码作图,而不是简单的点点鼠标?

      同样的数据,代码会赋予它更深的内涵

      鼠标操作的都是套路化的东西,你会别人也会,就像公司做的图都很sexy,但是他们并不关系你的数据体现了什么价值。只有在自己通过不断完善代码的过程中,才会对自己的数据有更深的理解,才有可能挖掘更多的信息。
      现在有许多一步出图,网站工具出图,很低的学习成本,做的图数量可能也不少,但是很多时候,自己都不知道这些图是怎么出来的,另外低学习成本的工具是不提供太多的拓展空间的。不知道你有没有这样的体会,在网站上做了一个图,很好看,基本符合预期,但是有一些线条形状/颜色或者图例位置需要改动,而网站上也没有这种设置,那么只好自己吭哧吭哧用PS、AI去编辑。心想:头脑中的图片很清楚,但为什么没有工具能帮我实现他的样子呢?于是,代码的价值就在这里

      代码会带给自己一种能力,去探索自己的数据,就像在玩魔方,不同角度的观察就有不同的解答

      可视化对于我们的作用:

      • 有了结果,需要展示给其他人

      • 还没有结果,甚至不知道从何下手,他可以帮你找到一些潜在的研究方向

      为什么做生信分析必备R?

      • 开源免费

      • 很庞大的社区
        【Bionconductor 基本你能想到的组学上的东西,别人都能提供帮助】

      • 强大可视化功能

      R的图形语法目前有两大类:

      • base:就像纸笔模型【不带橡皮擦】,直接出图做了不能撤销
        【打开R就加载】

      • grid 【包括 lattice + ggplot2】
        降低入门门槛;
        不直接出图,导出的是一个图形对象,可以继续编辑【相当于带了橡皮擦】
        画图是画在当前活动窗口

      • lattice:【安装R时装好,但需要自己加载】
        处理多维数据;
        使用grid修改细节,比ggplot2简单

      • ggplot2: 【需要自己安装并加载】
        使用图形语法,不用纠结太细枝末节的东西(比如那条线用什么颜色,它会帮你上色);
        作图更美观

        • 【图形都是点–线–面组合起来的】
          ggplot2最基本的元素:

          数据data + 几何对象geom(用于映射数据)+ 坐标(一般都是笛卡尔)
          geom又包括了:
          美学aesthetics:描述了可视化的特征(比如数据中对应点的位置、大小、颜色、形状)
          标尺scales:可视化的东西如何转为可以显示的值(比如取色范围、点映射范围),比如画气泡图就是把点的映射范围放大

        • ggplot2作图模版:

          ggplot()+
            geom_... ([data=data frame]
                      [aes(variable mappings)--关于映射设定]
                      [non-variable adjustments]--全局设定)

          下面就是数据和图片的对应关系:
          散点图关于Length和Width的,根据Species上色
      R与进化树(前言)
        复杂的图片就对应许多的图层layer,就像PS一样:
        【这张图看明白,就掌握了ggplot2的精髓,同时对以后使用ggtree也大有帮助】
      R与进化树(前言)

      归根结底:时刻记着做图的目的,是要呈现数据,而不是把图搞得多么漂亮。数据可视化的精髓在于探索数据~推荐学习ggplot2和grid


        点击底部的“阅读原文”,获得更好的阅读体验哦😻
        初学生信,很荣幸带你迈出第一步。

        我们是生信星球,一个不拽术语、通俗易懂的生信知识平台。需要帮助或提出意见请后台留言或发送邮件到Bioplanet520@outlook.com~

        R与进化树(前言)

      测试结尾

      请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!

      • 分享:
      作者头像
      weinfoeditor

      上一篇文章

      基因芯片(一)
      2018年7月10日

      下一篇文章

      花花读文献第二天--蛋白纯化方法
      2018年7月11日

      你可能也喜欢

      8-1651673488
      生信零基础入门学习小组长期报名中(2022仍继续)
      7 4月, 2022
      2-1651673738
      简化版的ROC曲线
      21 2月, 2022
      8-1651674718
      支持向量机模型
      19 11月, 2021

      搜索

      分类

      • R语言
      • TCGA数据挖掘
      • 单细胞RNA-seq测序
      • 在线会议直播预告与回放
      • 数据分析那些事儿分类
      • 未分类
      • 生信星球
      • 老俊俊的生信笔记

      投稿培训

      免费

      alphafold2培训

      免费

      群晖配置培训

      免费

      最新博文

      Nature | 单细胞技术揭示衰老细胞与肌肉再生
      301月2023
      lncRNA和miRNA生信分析系列讲座免费视频课和课件资源包,干货满满
      301月2023
      如何快速批量修改 Git 提交记录中的用户信息
      261月2023
      logo-eduma-the-best-lms-wordpress-theme

      (00) 123 456 789

      weinfoadmin@weinformatics.cn

      恒诺新知

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      链接

      • 课程
      • 事件
      • 展示
      • 问答

      支持

      • 文档
      • 论坛
      • 语言包
      • 发行状态

      推荐

      • iHub汉语代码托管
      • iLAB耗材管理
      • WooCommerce
      • 丁香园论坛

      weinformatics 即 恒诺新知。ICP备案号:粤ICP备19129767号

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      要成为一名讲师吗?

      加入数以千计的演讲者获得100%课时费!

      现在开始

      用你的站点账户登录

      忘记密码?

      还不是会员? 现在注册

      注册新帐户

      已经拥有注册账户? 现在登录

      close
      会员购买 你还没有登录,请先登录
      • ¥99 VIP-1个月
      • ¥199 VIP-半年
      • ¥299 VIP-1年
      在线支付 激活码

      立即支付
      支付宝
      微信支付
      请使用 支付宝 或 微信 扫码支付
      登录
      注册|忘记密码?