Counts到差异表达基因(二)- 有重复数据 – DiffAnalysis.r
参考: https://www.jianshu.com/p/0a092eaf0b9c
写在前面
在《原始数据到Counts数据》中,已经讲明白了,如何得到Counts表格。
总之,运行结束,你应该会得到以下文件
ls -1 *.csv
gene_count_matrix.csv
transcript_count_matrix.csv
其中一个是gene水平的Counts数据,一个是转录本水平的。除非有特殊要求,一般我们只使用基因水平的Counts。
那么接下来就是进行差异表达分析
准备输入文件
-
Counts文件
CSV格式,在上述我们已经准备好了,大体如下

2.样本信息文件,sample.info
注意,header必须是Sample type condition

样本信息,应该是将会用到的所有样本,比如(编一个)

3.两两比较的信息,comp.info
注意,header必须是Sample1 Sample2

这个文件比较重要,可以一次设置无限个比较方案,比如

这个输入,就会进行7个两两比较的差异表达分析
进行差异表达分析
进行差异表达分析,比较简单…(如果报错,找Junting Feng
Rscript /tools/XiaLabRNAseqPipe/DiffAnalysis.r gene_count_matrix.csv sample.info comp.info

等着,等到最后就完成了

输出的文件比较多,包括差异表达分析结果和PCA等

请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!