• 主页
  • 课程

    关于课程

    • 课程归档
    • 成为一名讲师
    • 讲师信息
    教学以及管理操作教程

    教学以及管理操作教程

    ¥1,000.00 ¥100.00
    阅读更多
  • 特色
    • 展示
    • 关于我们
    • 问答
  • 事件
  • 个性化
  • 博客
  • 联系
  • 站点资源
    有任何问题吗?
    (00) 123 456 789
    weinfoadmin@weinformatics.cn
    注册登录
    恒诺新知
    • 主页
    • 课程

      关于课程

      • 课程归档
      • 成为一名讲师
      • 讲师信息
      教学以及管理操作教程

      教学以及管理操作教程

      ¥1,000.00 ¥100.00
      阅读更多
    • 特色
      • 展示
      • 关于我们
      • 问答
    • 事件
    • 个性化
    • 博客
    • 联系
    • 站点资源

      老俊俊的生信笔记

      • 首页
      • 博客
      • 老俊俊的生信笔记
      • ribotish 质控结果复现及重新绘制

      ribotish 质控结果复现及重新绘制

      • 发布者 weinfoadmin
      • 分类 老俊俊的生信笔记
      • 日期 2022年3月10日
      测试开头


      一个努力中的公众号

      ribotish 质控结果复现及重新绘制

      1引言

      之前有提到过 ribotish 这个软件,用于质控比对到基因组上的 Ribo-seq 的 bam 文件。结果如下:

      ribotish 质控结果复现及重新绘制

      2安装

      github 地址:

      https://github.com/zhpn1024/ribotish

      $ pip install ribotish

      使用:

      $ ribotish quality -b chx.bam -g gene.gtf

      然后目录下会生成一个 pdf 和一个绘图数据和一个参数文件结果:

      ribotish 质控结果复现及重新绘制

      pdf 里的图如果放到文章里可能还不太美观,绘图的数据都在 txt 文件里,以字典格式保存,因为软件本身也是基于 python 分析的:

      ribotish 质控结果复现及重新绘制

      我打红勾的五个分别为左边 5 end matched 的数据,分别为reads 长度分布,距离 start codon,距离 stop codon 条形图,frame 分布及cds profile五个类型的图。

      我们尝试拿绘图数据提取出来在 R 里进行自定义绘制这五种图!还可以美化。

      下面是复现及拓展结果:

      ribotish 质控结果复现及重新绘制

      3reads 长度分布

      读取数据进来:

      library(ggplot2)
      library(ggsci)
      library(reshape2)
      library(tidyverse)
      library(cowplot)
      library(aplot)
      library(stringr)

      # load qc-data
      qc <- read.delim('ribo-EB.sorted_qual.txt',header = F)[1:5,] %>% as.data.frame()
      ribotish 质控结果复现及重新绘制

      处理数据转化成数据框:

      ################################################### reads length

      # process raw data
      rawlen <- qc[1,1] %>% str_replace(.,pattern = '\{',replacement = '') %>%
        str_replace(.,pattern = '\}',replacement = '') %>%
        str_split(.,pattern = ',') %>% unlist()

      # get length and reads number
      readlength = sapply(strsplit(rawlen,split = ':'), '[',1) %>% as.numeric()
      readsnumber = sapply(strsplit(rawlen,split = ':'), '[',2) %>% as.numeric()

      # to dataframe
      df_len <- data.frame(readlength,readsnumber)

      # check
      head(df_len,3)
      #   readlength readsnumber
      # 1         25      168849
      # 2         26      236643
      # 3         27      487806

      画图:

      # plot
      p1 <- ggplot(df_len,aes(y = factor(readlength),x = readsnumber/10^6)) +
        geom_col(fill = 'grey40') + theme_classic(base_size = 16) +
        theme(axis.ticks.length = unit(0.3,'cm'),
              # aspect.ratio = 3,
              axis.text.x = element_text(angle = 0),
              axis.title = element_text(size = 16),
              plot.margin = margin(1,1,1,0)) +
        scale_y_discrete(position = 'left') +
        # scale_x_reverse() +
        # ylab('Footprint length (nt)')
        ylab('') +
        xlab('Reads (x 10^6)')

      p1

      测试结尾

      请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!

      • 分享:
      作者头像
      weinfoadmin

      上一篇文章

      python 学习之 pandas 的基本功能-上
      2022年3月10日

      下一篇文章

      python 学习之 pandas 的基本功能-下
      2022年3月11日

      你可能也喜欢

      8-1651542331
      跟着Nature学绘图(2) 箱线图-累积分布曲线图
      2 5月, 2022
      9-1651542322
      Julia 笔记之字符串
      2 5月, 2022
      0-1651542343
      Julia 笔记之数学运算和初等函数
      1 5月, 2022

      搜索

      分类

      • R语言
      • TCGA数据挖掘
      • 单细胞RNA-seq测序
      • 在线会议直播预告与回放
      • 数据分析那些事儿分类
      • 未分类
      • 生信星球
      • 老俊俊的生信笔记

      投稿培训

      免费

      alphafold2培训

      免费

      群晖配置培训

      免费

      最新博文

      Nature | 单细胞技术揭示衰老细胞与肌肉再生
      301月2023
      lncRNA和miRNA生信分析系列讲座免费视频课和课件资源包,干货满满
      301月2023
      如何快速批量修改 Git 提交记录中的用户信息
      261月2023
      logo-eduma-the-best-lms-wordpress-theme

      (00) 123 456 789

      weinfoadmin@weinformatics.cn

      恒诺新知

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      链接

      • 课程
      • 事件
      • 展示
      • 问答

      支持

      • 文档
      • 论坛
      • 语言包
      • 发行状态

      推荐

      • iHub汉语代码托管
      • iLAB耗材管理
      • WooCommerce
      • 丁香园论坛

      weinformatics 即 恒诺新知。ICP备案号:粤ICP备19129767号

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      要成为一名讲师吗?

      加入数以千计的演讲者获得100%课时费!

      现在开始

      用你的站点账户登录

      忘记密码?

      还不是会员? 现在注册

      注册新帐户

      已经拥有注册账户? 现在登录

      close
      会员购买 你还没有登录,请先登录
      • ¥99 VIP-1个月
      • ¥199 VIP-半年
      • ¥299 VIP-1年
      在线支付 激活码

      立即支付
      支付宝
      微信支付
      请使用 支付宝 或 微信 扫码支付
      登录
      注册|忘记密码?