• 主页
  • 课程

    关于课程

    • 课程归档
    • 成为一名讲师
    • 讲师信息
    同等学历教学

    同等学历教学

    免费
    阅读更多
  • 特色
    • 展示
    • 关于我们
    • 问答
  • 事件
  • 个性化
  • 博客
  • 联系
  • 站点资源
    有任何问题吗?
    (00) 123 456 789
    weinfoadmin@weinformatics.cn
    注册登录
    恒诺新知
    • 主页
    • 课程

      关于课程

      • 课程归档
      • 成为一名讲师
      • 讲师信息
      同等学历教学

      同等学历教学

      免费
      阅读更多
    • 特色
      • 展示
      • 关于我们
      • 问答
    • 事件
    • 个性化
    • 博客
    • 联系
    • 站点资源

      未分类

      • 首页
      • 博客
      • 未分类
      • circlize 之 Create plotting regions

      circlize 之 Create plotting regions

      • 发布者 weinfoadmin
      • 分类 未分类, 老俊俊的生信笔记
      • 日期 2021年9月10日
      • 评论 0评论

      感谢老俊俊的大力支持。我们会每日跟新,欢迎您关注老俊俊的生信笔记。






      circos. genomictrackploregions()或 circos.genomicTrack()创建轨道和添加图形。在下面的例子中,染色体作为基因组类别,我们假设 data 是 BED 格式的简单数据框(第一列是染色体名称,第二列和第三列是起始位置和结束位置,下面的列是相关值)。

      与 circos.track()类似,circos.genomicTrack()也接受自定义函数面板 panel.fun,适用于每个单元格,但形式不同:

      circos.genomicTrackPlotRegion(data, panel.fun = function(region, value, ...) {
          circos.genomicPoints(region, value, ...)
      })

      在 panel.fun 里用户可以使用低级图形函数在每个单元格中添加基本图形。panel.fun 需要两个参数 region 和 value,它们被自动处理并从 circos.genomicTrack()传递。region 是一个两列数据框,仅包含当前染色体的起始位置和结束位置。value 也是包含其他列的数据框(如果第四列存在,则从第四列开始)。因此,基本上可以认为 region 是 x 轴上的值,value 是 y 轴上的值。

      下面的代码演示了在 panel.fun 中使用 region 和 value 的值:

      bed = generateRandomBed(nc = 2)
      head(bed, n = 2)
      ##    chr  start     end     value1     value2
      ## 1 chr1  55659  272460  0.1481202 -0.9773213
      ## 2 chr1 994899 1136003 -1.1922246  0.3737273
      circos.initializeWithIdeogram(plotType = NULL)
      circos.genomicTrackPlotRegion(bed, panel.fun = function(region, value, ...) {
          if(CELL_META$sector.index == "chr1") {
              print(head(region, n = 2))
              print(head(value, n = 2))
          }
      })

      ##    start     end
      ## 1  55659  272460
      ## 2 994899 1136003
      ##       value1     value2
      ## 1  0.1481202 -0.9773213
      ## 2 -1.1922246  0.3737273

      由于 circos.genomicTrack()创建了一个新的轨道,它需要一些值来计算 y 方向上的数据范围。用户可以通过 numeric.column 指定数据中数字列的索引(命名索引或数字索引,也可以是一个有多个列的向量)或直接设置 ylim。如果没有设置,该函数将尝试查找数据中的所有数字列(当然,不包括前三列),并将它们设置为 numeric.column:

      circos.genomicTrackPlotRegion(data, ylim = c(0, 1),
          panel.fun = function(region, value, ...) {
              circos.genomicPoints(region, value, ...)
      })
      circos.genomicTrackPlotRegion(data, numeric.column = c("value1", "value2"),
          panel.fun = function(region, value, ...) {
              circos.genomicPoints(region, value, ...)
      })

      由于基因组函数是由基本的函数实现的,您可以在任何地方使用 circos.info()来获取扇区和轨道的信息。

      1、点


      circos.genomicPoints()的用法与 circos.points()类似。circos.genomicPoints()需要一个包含基因组 region 的两列数据和一个包含相应 value 的数据。点总是画在每个区域的中间。用于绘图的 y 值的数据列应由 numeric.column 指定。如果 numeric.column 的长度大于一,所有指定的列将用于添加点。

      用法:

      circos.genomicPoints(region, value, numeric.column = c(1, 2))
      circos.genomicPoints(region, value, cex, pch)
      circos.genomicPoints(region, value, sector.index, track.index)
      circos.genomicTrack(data, numeric.column = 4,
          panel.fun = function(region, value, ...) {
              # numeric.column is automatically passed to `circos.genomicPoints()`
              circos.genomicPoints(region, value, ...)
      })

      如果只有一个数字列,图形参数(如 pch、cex)的长度可以是 1 或 region 行数。如果指定了多个数字列,则将迭代地添加每个数字列的点,图形参数的长度应为 1 或指定的数字列的数量。

      2、线


      circos.genomicLines()类似于 circos.lines()。图形参数的设置类似于 circos.genomicPoints():

      circos.genomicLines(region, value, ...)
      circos.genomicLines(region, value, numeric.column = c(1, 2))
      circos.genomicLines(region, value, area, baseline, border)
      circos.genomicLines(region, value, sector.index, track.index)
      circos.genomicLines(region, value, lwd, lty = "segment")

      3、文本


      对于 circos.genomicText(), text 的位置可以通过 numeric.column 指定。列或分隔向量 y。文本的标签可以通过 labels.column 指定。或一个 labels 向量。

      circos.genomicText(region, value, ...)
      circos.genomicText(region, value, y = 1, labels)
      circos.genomicText(region, value, numeric.column, labels.column)
      circos.genomicText(region, value, facing, niceFacing, adj)
      circos.genomicText(region, value, sector.index, track.index)

      4、矩形


      对于 circos.genomicRect(),由于矩形的左右已经由基因组区域的 start 和 end 决定,我们只需要指定矩形的顶部和底部的位置:ytop,ybottom 或 ytop.column,ybottom.column。

      circos.genomicRect(region, value, ytop = 1, ybottom = 0)
      circos.genomicRect(region, value, ytop.column = 2, ybottom = 0)
      circos.genomicRect(region, value, col, border)

      5、连接


      circo.genomiclink()期望有两个数据,它将从第一数据中的基因组区域添加到第二数据中相应的基因组区域的连接。所有其它参数参考 circos.link()。

      set.seed(123)
      bed1 = generateRandomBed(nr = 100)
      bed1 = bed1[sample(nrow(bed1), 20), ]
      bed2 = generateRandomBed(nr = 100)
      bed2 = bed2[sample(nrow(bed2), 20), ]

      circos.initializeWithIdeogram()
      circos.genomicLink(bed1, bed2, col = rand_color(nrow(bed1), transparency = 0.5),
          border = NA)
      circos.clear()

      circos.genomicTrack 函数模式

      1、普通模式


      A、输入数据是 1 个数据框

      如果输入数据是 BED 格式的数据,则在 panel.fun 中,region 是一个包含从数据中提取的当前染色体的起始位置和结束位置。value 也是一个数据框,它不包括前三列的数据中的列。

      data = generateRandomBed(nc = 2)
      circos.genomicTrack(data, numeric.column = 4,
          panel.fun = function(region, value, ...) {
              circos.genomicPoints(region, value, ...)
              circos.genomicPoints(region, value)
              # 1st column in `value` while 4th column in `data`
              circos.genomicPoints(region, value, numeric.column = 1)
      })

      B、输入数据列表形式的数据框如果输入数据是列表,则 panel.fun 在每个数据框上迭代地应用到当前单元格。在此条件下,region 和 value 将包含当前数据框和当前染色体中的数据。当前数据框的索引可以通过 getI(…)得到。注意 getI(…)只能在 panel.fun 内部使用。

      当在 circos.genomicTrack()中指定 numeric.column 时,numeric.column 的长度只能是 1 或数据框的数量,这意味着,在每个数据框中只有一个数值列将被使用。如果未指定,则使用每个数据框中的第一个数值列。

      bed_list = list(generateRandomBed(), generateRandomBed())
      circos.genomicTrack(bed_list,
          panel.fun = function(region, value, ...) {
              i = getI(...)
              circos.genomicPoints(region, value, col = i, ...)
      })

      # column 4 in the first bed and column 5 in the second bed
      circos.genomicTrack(bed_list, numeric.column = c(4, 5),
          panel.fun = function(region, value, ...) {
              i = getI(...)
              circos.genomicPoints(region, value, col = i, ...)
      })

      2、堆叠模式


      circos.genomicTrack()也通过设置 stack = TRUE 来支持堆栈模式。在堆栈模式下,ylim 在函数内部被重新定义,y 轴被分割成几个高度相等的箱子,图形被放到水平箱子上(position y = 1,2,…)。

      A、输入数据是 1 个数据框

      在堆叠模式下,当输入数据是包含一个或多个数值列的单个数据框时,每个在 numeric.column 的数值列将被视为单个单元(列未指定,则使用所有数值列)。ylim 被重新定义为 c(0.5, n+0.5),其中 n 是指定的数值列的数量。panel.fun 迭代地应用于每个数值列,并向水平线 y = i 添加图形。实际上,例如 circos.genomicPoints()中的值不用于映射 y 位置,而在内部被 y = i 替换。

      在每个迭代中,在 panel.fun 中,region 仍然是当前染色体中的基因组区域,但 value 只包含当前数值列和所有非数值列。当前数值列的索引值可以通过 getI(…)获得。

      data = generateRandomBed(nc = 2)
      circos.genomicTrack(data, stack = TRUE,
          panel.fun = function(region, value, ...) {
              i = getI(...)
              circos.genomicPoints(region, value, col = i, ...)
      })

      B、输入数据列表形式的数据框

      当输入数据是列表时,每个数据框将被视为一个单独的单元。ylim 被重新定义为 c(0.5, n+0.5),其中 n 是数据框的数量。panel.fun 将迭代地应用于每个数据框。在每个迭代中,在 panel.fun 中,region 仍然是当前染色体中的基因组区域,value 包含当前数据中不包括前三列的列。图形将被添加到“水平箱”上。

      bed_list = list(generateRandomBed(), generateRandomBed())
      circos.genomicTrack(bed_list, stack = TRUE,
          panel.fun = function(region, value, ...) {
              i = getI(...)
              circos.genomicPoints(region, value, ...)
      })

      在堆叠模式下,如果使用具有多个数值列的数据框,则所有水平箱上的图形共享相同的基因组位置,而如果使用数据框列表,则基因组位置可能不同。

      应用


      A、添加点

      绘制画板:

      set.seed(999)
      circos.par("track.height" = 0.1, start.degree = 90,
          canvas.xlim = c(0, 1), canvas.ylim = c(0, 1), gap.degree = 270)
      circos.initializeWithIdeogram(chromosome.index = "chr1", plotType = NULL)

      在轨道 A 中,这是最常见的加点方法。这里的 bed 只包含一个数值列,点被加在区域的中间:

      bed = generateRandomBed(nr = 300)
      circos.genomicTrack(bed, panel.fun = function(region, value, ...) {
          circos.genomicPoints(region, value, pch = 16, cex = 0.5, ...)
      })

      在轨道 B 中,如果它被指定为堆叠模式,点将被添加到水平线(或者在视觉上是圆形线)中:

      circos.genomicTrack(bed, stack = TRUE,
          panel.fun = function(region, value, ...) {
              circos.genomicPoints(region, value, pch = 16, cex = 0.5,...)
              i = getI(...)
              circos.lines(CELL_META$cell.xlim, c(i, i), lty = 2, col = "#00000040")
      })

      在轨道 C 中,输入数据是两个数据框的列表。panel.fun 迭代地应用于每个数据框。当前索引的索引可以通过 getI(…)得到:

      bed1 = generateRandomBed(nr = 300)
      bed2 = generateRandomBed(nr = 300)
      bed_list = list(bed1, bed2)
      circos.genomicTrack(bed_list,
          panel.fun = function(region, value, ...) {
              i = getI(...)
              circos.genomicPoints(region, value, pch = 16, cex = 0.5, col = i, ...)
      })

      在轨道 D 中,数据框列表在堆叠模式下绘制。与每个数据框相对应的图形被添加到一条水平线上:

      circos.genomicTrack(bed_list, stack = TRUE,
          panel.fun = function(region, value, ...) {
              i = getI(...)
              circos.genomicPoints(region, value, pch = 16, cex = 0.5, col = i, ...)
              circos.lines(CELL_META$cell.xlim, c(i, i), lty = 2, col = "#00000040")
      })

      在轨道 E 中,数据框有四列数值。在普通模式下,所有四列都使用相同的基因组坐标:

      bed = generateRandomBed(nr = 300, nc = 4)
      circos.genomicTrack(bed,
          panel.fun = function(region, value, ...) {
              circos.genomicPoints(region, value, pch = 16, cex = 0.5, col = 1:4, ...)
      })

      轨道 F 中,数据框有四列数值,但在堆叠模式下绘制。每一列的图形被添加到一条水平线上。当前列可以通过 getI(…)获取。注意 panel.fun 的值是一个只有一列的数据帧(即当前的数字列):

      bed = generateRandomBed(nr = 300, nc = 4)
      circos.genomicTrack(bed, stack = TRUE,
          panel.fun = function(region, value, ...) {
              i = getI(...)
              circos.genomicPoints(region, value, pch = 16, cex = 0.5, col = i, ...)
              circos.lines(CELL_META$cell.xlim, c(i, i), lty = 2, col = "#00000040")
      })
      circos.clear()

      B、添加线

      与前面的图相似:

      circos.par("track.height" = 0.08, start.degree = 90,
          canvas.xlim = c(0, 1), canvas.ylim = c(0, 1), gap.degree = 270,
          cell.padding = c(0, 0, 0, 0))
      circos.initializeWithIdeogram(chromosome.index = "chr1", plotType = NULL)

      在轨道 A 中,这是最简单的添加直线的方法。区域的中点用作 x 轴上的值:

      bed = generateRandomBed(nr = 500)
      circos.genomicTrack(bed,
          panel.fun = function(region, value, ...) {
              circos.genomicLines(region, value)
      })

      circos.genomicLines()由 circos.lines()实现,因此,circos.lines()中支持的参数也可以在 circos.genomicLines()中。在轨道 B 中,直线下面的区域用颜色填充,在轨道 C 中,直线类型设置为 h:

      circos.genomicTrack(bed,
          panel.fun = function(region, value, ...) {
              circos.genomicLines(region, value, area = TRUE)
      })
      circos.genomicTrack(bed,
          panel.fun = function(region, value, ...) {
              circos.genomicLines(region, value, type = "h")
      })

      在轨道 D 中,输入是数据框的列表。panel.fun 迭代地应用于每个数据框:

      bed1 = generateRandomBed(nr = 500)
      bed2 = generateRandomBed(nr = 500)
      bed_list = list(bed1, bed2)
      circos.genomicTrack(bed_list,
          panel.fun = function(region, value, ...) {
              i = getI(...)
              circos.genomicLines(region, value, col = i, ...)
      })

      在轨道 E 中,输入是数据框的列表,并在堆叠模式下绘制。每个基因组区域被画成一个水平段,并放在一条水平线上,这条线的宽度与基因组区域的宽度相对应。在堆叠模式下,对于 circos.genomicLines(),线的类型仅限于片段:

      circos.genomicTrack(bed_list, stack = TRUE,
          panel.fun = function(region, value, ...) {
              i = getI(...)
              circos.genomicLines(region, value, col = i, ...)
      })

      在轨道 F 中,输入是一个有四个数字列的数据框。每一列都是在普通模式下绘制的,共享相同的基因组坐标:

      bed = generateRandomBed(nr = 500, nc = 4)
      circos.genomicTrack(bed,
          panel.fun = function(region, value, ...) {
              circos.genomicLines(region, value, col = 1:4, ...)
      })

      在轨道 G 中,在堆叠模式下绘制带有四列数值的数据框。所有四列都被画成四条水平线:

      bed = generateRandomBed(nr = 500, nc = 4)
      circos.genomicTrack(bed, stack = TRUE,
          panel.fun = function(region, value, ...) {
              i = getI(...)
              circos.genomicLines(region, value, col = i, ...)
      })

      在轨道 H 中,我们将 type 指定为 segment,并为 segment 设置不同的颜色。注意,每个分段位于数值列中定义的 y 位置:

      bed = generateRandomBed(nr = 200)
      circos.genomicTrack(bed,
          panel.fun = function(region, value, ...) {
              circos.genomicLines(region, value, type = "segment", lwd = 2,
                  col = rand_color(nrow(region)), ...)
      })
      circos.clear()

      C、添加矩形

      对于矩形,填充的颜色用数值来表示。这里我们定义了一个颜色映射函数 col_fun 来将值映射到颜色:

      circos.par("track.height" = 0.15, start.degree = 90,
          canvas.xlim = c(0, 1), canvas.ylim = c(0, 1), gap.degree = 270)
      circos.initializeWithIdeogram(chromosome.index = "chr1", plotType = NULL)
      col_fun = colorRamp2(breaks = c(-1, 0, 1), colors = c("green", "black", "red"))

      要绘制热图,可能需要使用堆叠模式。在轨道 A 中,bed 有四个数值列,热图采用堆叠方式排列。你可以看到矩形是堆叠在一个特定的基因组区域:

      bed = generateRandomBed(nr = 100, nc = 4)
      circos.genomicTrack(bed, stack = TRUE,
          panel.fun = function(region, value, ...) {
              circos.genomicRect(region, value, col = col_fun(value[[1]]), border = NA, ...)
      })

      在轨道 B 中,输入是数据框的列表。在堆叠模式下,每个数据框被添加到一条水平线上。由于不同数据框的基因组位置可能不同,你可以在图中看到,这两组矩形的位置是不同的。

      在堆叠模式下,默认情况下,矩形的高度是在内部设置的,以使它们完全填充垂直方向的单元格。ytop 和 ybottom 可以用来调整矩形的高度。注意,矩形的每一行都是 y = i,矩形的默认高度是 1:

      bed1 = generateRandomBed(nr = 100)
      bed2 = generateRandomBed(nr = 100)
      bed_list = list(bed1, bed2)
      circos.genomicTrack(bed_list, stack = TRUE,
          panel.fun = function(region, value, ...) {
              i = getI(...)
              circos.genomicRect(region, value, ytop = i + 0.3, ybottom = i - 0.3,
                  col = col_fun(value[[1]]), ...)
      })

      在轨道 C 中,我们实现了与轨道 B 相同的图形,但使用的是普通模式。在堆叠模式下,y 轴上的数据范围和矩形的位置是内部调整的。这里我们明确地在正常模式下调整它:

      circos.genomicTrack(bed_list, ylim = c(0.5, 2.5),
          panel.fun = function(region, value, ...) {
              i = getI(...)
              circos.genomicRect(region, value, ytop = i + 0.3, ybottom = i - 0.3,
                  col = col_fun(value[[1]]), ...)
      })

      在轨道 D 中,矩形被用来制作 barplot。我们通过 ytop.column 指定条形的顶部位置。(1 表示 value 的第一列):

      bed = generateRandomBed(nr = 200)
      circos.genomicTrack(bed,
          panel.fun = function(region, value, ...) {
              circos.genomicRect(region, value, ytop.column = 1, ybottom = 0,
                  col = ifelse(value[[1]] > 0, "red", "green"), ...)
              circos.lines(CELL_META$cell.xlim, c(0, 0), lty = 2, col = "#00000040")
      })
      circos.clear()




      发现更多精彩

      关注公众号

      欢迎小伙伴留言评论!

      点击我留言!

      今天的分享就到这里了,敬请期待下一篇!

      最后欢迎大家分享转发,您的点赞是对我的鼓励和肯定!

      如果觉得对您帮助很大,打赏一下吧!

      推 荐 阅 读




      • circlize 之可视化基因组数据

      • circlize 之 Advanced layout

      • circlize 之 circos.heatmap()

      • circlize 之 Implement high-level circular plots

      • 怎么批量合并 data.frame ?

      • QPCRpro 正式上线!

      • circlize 之 Legends

      • QPCR数据添加 p 值和显著性一次解决!

      • circlize 之 Graphics

      • circlize 之 Introduction

      • circlize 之 Circular layout

      • 鉴定差异翻译效率基因之 deltaTE 下篇

      • 鉴定差异翻译效率基因之 deltaTE 上篇

      • 鉴定差异翻译效率基因之 Riborex

      • purrr 包之 list 处理系列函数

      • purrr 包之 map 系列函数

      • 批量绘制单基因相关性图

      • Y 叔出品:ggfun

      • 神器之 computeMatrix + 绘图

      • Deeptools 神器之 bamCoverage

      • 在线版shiny pheatmap!

      • QPCR数据快速分析和绘图 — by shiny

      • RNA-seq:Salmon 快速定量

      • RNA-seq:Salmon 定量结果差异分析

      • 用R提取代表转录本

      • 画个CNS级别火山图!

      • R Tips :split 函数

      • 什么? R 版 Hisat2

      • R Tips :match 函数

      • conda 安装软件报错

      • MetaProfile on Transcript

      • 提取代表转录本之 gencode

      • 附近含有 m6A 修饰的 Stop Codon 序列提取

      • Introduction of m6A

      • RNA-seq : Hisat2+Stringtie+DESeq2

      • shiny VennDiagram

      • shiny CountToTPM/FPKM

      • 自己模仿画个– m6A distribution on transcript

      • 怎么把 shiny App 做成 exe 文件进行分发

      • shiny-server内网穿透

      • 在线版shiny pheatmap!

      • 用shiny创作在线火山图绘制App

      请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!

      • 分享:
      作者头像
      weinfoadmin

      上一篇文章

      circlize 之 High-level genomic functions
      2021年9月10日

      下一篇文章

      circlize 之可视化基因组数据
      2021年9月10日

      你可能也喜欢

      2-1675088548
      lncRNA和miRNA生信分析系列讲座免费视频课和课件资源包,干货满满
      30 1月, 2023
      9-1675131201
      如何快速批量修改 Git 提交记录中的用户信息
      26 1月, 2023
      8-1678501786
      肿瘤细胞通过改变CD8+ T细胞中的丙酮酸利用和琥珀酸信号来调控抗肿瘤免疫应答。
      7 12月, 2022

      留言 取消回复

      要发表评论,您必须先登录。

      搜索

      分类

      • R语言
      • TCGA数据挖掘
      • 单细胞RNA-seq测序
      • 在线会议直播预告与回放
      • 数据分析那些事儿分类
      • 未分类
      • 生信星球
      • 老俊俊的生信笔记

      投稿培训

      免费

      alphafold2培训

      免费

      群晖配置培训

      免费

      最新博文

      Nature | 单细胞技术揭示衰老细胞与肌肉再生
      301月2023
      lncRNA和miRNA生信分析系列讲座免费视频课和课件资源包,干货满满
      301月2023
      如何快速批量修改 Git 提交记录中的用户信息
      261月2023
      logo-eduma-the-best-lms-wordpress-theme

      (00) 123 456 789

      weinfoadmin@weinformatics.cn

      恒诺新知

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      链接

      • 课程
      • 事件
      • 展示
      • 问答

      支持

      • 文档
      • 论坛
      • 语言包
      • 发行状态

      推荐

      • iHub汉语代码托管
      • iLAB耗材管理
      • WooCommerce
      • 丁香园论坛

      weinformatics 即 恒诺新知。ICP备案号:粤ICP备19129767号

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      要成为一名讲师吗?

      加入数以千计的演讲者获得100%课时费!

      现在开始

      用你的站点账户登录

      忘记密码?

      还不是会员? 现在注册

      注册新帐户

      已经拥有注册账户? 现在登录

      close
      会员购买 你还没有登录,请先登录
      • ¥99 VIP-1个月
      • ¥199 VIP-半年
      • ¥299 VIP-1年
      在线支付 激活码

      立即支付
      支付宝
      微信支付
      请使用 支付宝 或 微信 扫码支付
      登录
      注册|忘记密码?