科学网

 找回密码
  注册

tag 标签: 富集分析

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

转录因子富集分析
mashengwei 2018-11-13 22:23
转录因子富集分析 转录因子因子富集分析背后的原理与GO,KEGG等富集分析是一样的。 这里还是使用Y叔的R包“clusterProfiler”。 首先我们要知道哪些基因是转录因子,并且属于哪一个转录因子家族。这个信息可以在这里下载(https://pan.baidu.com/s/12Zi-FvySMuaWyM2b9_2yuA)。这个文件中只需要两列,一列是转录因子家族的名字,一列是基因的名字。根据这个文件,整理出共有多少个转录因子家族,并给每个转录因子家族一个唯一的编号。将编号和名字存入一个新文件。 上面是所有转录因子,首先要筛选出在我们样品中表达的转录因子。 其次需要确认差异表达的转录因子。 最后需要一个转录因子编号和名字的对应文件。 样品中表达的转录因子,输入格式如下:共两列,第一列是转录因子家族编号,第二列是基因ID。其中编号是根据刚刚下载的文件整理而来。即一个基因家族有唯一一个编号。 差异表达的转录因子,输入格式如下:只有一列,基因的ID image-20181113214653231 还需要是一个转录因子ID和名字的对应文件,输入格式如下: \0 准备好之后,直接套用GO分析的代码就好。 #设置工作目录 setwd( /Users/markdown/6DS/RNA-seq/DEG3 ) #加载需要的R包 library ( clusterProfiler ) library (ggplot2) library (stringr) #读入差异表达的转录因子,注意这里分隔符是\\t,默认没有表头。如果是逗号分隔符请使用sep=, gene-read.csv( NS1vsCT_DEG_TF_list.txt ,header= FALSE ,sep= \\t ) gene-as.factor(gene$V1) #读入在样本中表达的转录因子,这一部分即是背景基因 term2gene-read.csv( NS1vsCT_DEG_TF_background.txt ,header= FALSE ,sep= \\t ) #读入转录因子ID与名字对应的文件 term2name-read.csv( ~/Desktop/scripts/TF_analysis/TF_name.txt ,header= FALSE ,sep= \\t ) #进行富集分析 x-enricher(gene,TERM2GENE=term2gene,TERM2NAME=term2name) #富集分析结果保存到文件 out_file-paste( DEG_NS1vsCT_HC_TF_enricher.out.txt ,sep= \\t ) write.csv(x,out_file) #图片展示 dotplot(x,showCategory= 10 ) #保存图片 ggsave(filename= DEG_NS1vsCT_HC_TF_enricher_dotplot.png ,dpi= 600 ) dev.off() 结果展示 结果部分其实还有很多形式展示,具体的请见Y叔的R包clusterProfiler的说明。Y叔今年一月份在bioRxiv上在线一篇文章可以参考clusterProfiler: An universal enrichment tool for functional and comparative study。 Y叔文中展示的图片 其实基因家族也是可以做富集分析的。只要知道哪些基因属于哪个基因家族就可以了。但是目前,我还没找到相关的文件。唯一想到的是可以根据PFAM ID做,也即蛋白结构域的ID。
13463 次阅读|0 个评论
ggplot2富集分析图
Polya 2017-4-14 11:04
ggplot2 富集分析图 功能:是用来展示组成的事物类别在相应类别总体分布中的比例 本质:将相应类别的总体的分布考虑进去,得到相应的比例 组成: Y 轴以注释信息类别 X 轴以 富集因子 为主进行转换 GO 富集分析: GO 在指定基因集中的所占的比例 基因富集分析 : 是指将基因按照先验知识,也就是基因组注释信息进行分类。 # Clear workspace rm(list = ls()) library(ggplot2) #library(ggplot2) #set your path path-setwd(D:/Test/R/R_paint) dat - read.table(umf.txt, header=T,sep=\t) dat #pdf(file=rich.pdf,width=10,height = 6) png(rich.png,width=600,height=800) ggplot(data=dat,aes(x=Rich_factor,y=Description,colour=qValue,size=Gene_number)) + geom_point() +scale_size_area() + scale_colour_gradientn(colours=c(red,yellow,green,blue))+ labs(x=Rich factor,y=Pathway of KEGG,title= up KEGG enrich of DEGs between Middle and Fresh)+ #theme(plot.title=element_text(size=16,colour=black,hjust=0.5))+ theme(plot.title=element_text(size=16,colour=black, hjust=0.5))+ theme(axis.title.y=element_text(size=14,colour=black))+ theme(axis.title.x=element_text(size=14,colour=black))+ theme(legend.text=element_text(size=14,colour=black),legend.title=element_text(size=12))+ theme(axis.text.x=element_text(size=14,colour=black))+ theme(axis.text.y=element_text(size=14,colour=black))+ theme(panel.grid.minor=element_blank()) dev.off() 参考: https://guangchuangyu.github.io/cn/2012/04/enrichment-an
个人分类: ggplot2|11 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-16 03:51

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部