科学网

 找回密码
  注册

tag 标签: ChIP-seq

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

省钱了,以后chip-seq不用做control了!用机器学习替代ChIP-seq中的control
chinapubmed 2019-3-17 14:20
ChIP-seq是鉴定转录因子结合的一种常用技术,但存在背景信号,传统做法是用一个对照(control)数据集进行校正,去掉背景信号,但是对照也存在“bias”:一套对照可能会miss潜在的bias来源。白话就是:一个对照在A基因处ok,在B基因处也ok吗? 利用公共数据库中的大量control数据集,机器学习发挥了其优点,可以这些公共的control评估背景信号,并更加准确地识别峰。 AIControl能够(i)以高分辨率评估背景信号;(ii)以一种数据驱动的方式,系统地权衡最合适的对照数据集;(iii)捕获可能被一套对照数据集错过的潜在偏倚来源;和(iv)去掉昂贵且耗时的对照实验需求。 用一堆control来学习某位点(例如基因A)处,到底该用哪个对照。bias少了,更加准确了! ChIP-seq也能进入到AI大数据时代了! PS:所有优点集中在一起,最终还是优点吗?观望! https://github.com/suinleelab/AIControl.jl
个人分类: 软件|3549 次阅读|0 个评论
[转载]ChIPWig -- 一种可随机访问的无损和有损ChIP-seq Wig数据压缩方法
chinapubmed 2019-3-9 19:56
ChIP-seq实验产生了大量数据集,提出了重大的存储和维护挑战。为了解决这个问题,提出了一种专门为ChIP-seq Wig数据设计的无损和有损压缩框架,叫做ChIPWig。 ChIPWig能够随机访问,概括统计查询,它基于为不均匀量化器而设计的最佳点密度非对称理论。 在由ENCODE协会产生的10套ChIP-seq数据集上测试了ChIPWig压缩器。平均来说,无损ChIPWig减小原始文件大小到仅仅 6% ,并且提供了比bigWig高6倍的压缩率改善。有损特征比无损模式进一步减少文件大小2倍,对于使用专门的NarrowPeaks方法进行峰识别和motif发现几乎没有影响。使用通用计算机,压缩和解压速率大约为0.2 MB/秒。 简单用法:wig2chipwig in.wig out.chipwig 下载:https://github.com/vidarmehr/ChIPWig-v2 语言:C++ 时间:20171026 参考: ChIPWig: A Random Access-Enabling Lossless and Lossy Compression Method for ChIP-seq Data
个人分类: 软件|1876 次阅读|0 个评论
上传NGS数据到GEO
热度 1 hayidahubei 2018-12-4 07:38
以下信息都是基于个人最近一年的经验。GEO网站可能会更新,具体信息可以登录GEO官网查看。 上传数据官网: https://www.ncbi.nlm.nih.gov/geo/info/submission.html 1 注册账号 https://www.ncbi.nlm.nih.gov/account/register/?back_url=/geo/submitter/ 2 文件准备:上传的文件包含三部分(一个 Excel 表格,处理的数据文件,原始数据) 详情请根据以下网站 https://www.ncbi.nlm.nih.gov/geo/info/seq.html 第一部分是一个 Excel 表格( a metadata spreadsheet )里面有本次课题的基本信息,所有文件信息。按要求填好。 metadata spreadsheet 的模板可以从以下链接下载: https://www.ncbi.nlm.nih.gov/geo/info/examples/seq_template_v2.1.xls 第二个部分是 processed data files. 包含完整的表达谱(行基因,列样本,值可以是标准化后的也可以是原始的 read count ), peak 信息文件( bed, txt ),可视化文件 (bigwig, WIG, bedGraph) 等 . 我一般会准备一个表达谱(RNA-seq)或者bigwig和peak文件(ChIP-Seq) 第三部分是原始数据,对于 NGS 数据而言就是原始的 fastq 文件。但是这里 GEO 强烈建议上传压缩的文件。我一般都是压缩为 .gz 文件 将准备好的三部分文件全部放到以你账号名相同的文件夹中。 例如你的账号名为“ zhangsan ” , 你就需要创建一个文件夹名字为“ zhangsan ” , 然后将所有文件放到这个文件夹中。 3 上传文件(这里仅以 FTP 为例) https://www.ncbi.nlm.nih.gov/geo/info/submissionftp.html#creds 我用 FileZilla 登录 GEO ( host , ftp-private.ncbi.nlm.nih.gov; username, geo; password, ****** )。具体账号信息网页上会有。 登录上 GEO 后直接将上面的文件拖拽到 GEO,如下图所示 4 通知 GEO 你已经上传完文件。 https://submit.ncbi.nlm.nih.gov/geo/submission/ 我每次都是通过两种方式通知 GEO 。第一种方式是通过以上链接,第二种方式是通过 email ( geo@ncbi.nlm.nih.gov ) . Email 内容如下: \0 \0 5 等候 GEO 的回信。我一般在两天内收到回信,里面会给你一个 GSE 号 6 文章接收后就可以登录 GEO 修改数据状态, release 你的数据
6618 次阅读|1 个评论
ChIPseq数据分析基础 + ENCODE pipeline Q & A视频
ChengyangWang 2017-12-19 10:07
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome 作者:小哈 来源: 嘉因 德国海德堡大学ChIP-seq数据分析基础课程视频 用公共数据,就一定会用到ENCODE的ChIP-seq数据,ENCODE怎么处理来自众多实验室的结果?怎样消除batch effect?怎样处理重复?怎样比较?看视频找答案——ENCODE IDR pipeline QA 点击左下角“阅读原文”,直达ENCODE Pipeline页面
个人分类: Chip-seq|3849 次阅读|0 个评论
ChIP-seq基础知识视频集锦 | MIT公开课
ChengyangWang 2017-12-19 10:06
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome 作者:小丫 来源: 嘉因 MIT公开课ChIP-seq课程视频,ppt+黑板讲解,推荐 ChIP-seq基础知识和分析原理,白板讲解,精炼 能听懂下面这段,说明你的ChIP基本原理已经炉火纯青 同期推送ChIP实验视频,国语解说,繁体字幕,快去看看吧! 您可能还想看 大晚上做实验吃夜宵,薯条薯片的正确打开方式 ——薯片薯条告诉你什么是ChIP-seq ChIP-seq之黑客帝国 ——充满魔性,绝对提神 ChIP实验,这家公司做的怎么样?有图有真相 ——嘉因做ChIP实验产生的ChIP-seq数据质量汇总
个人分类: Chip-seq|2292 次阅读|0 个评论
最靠谱的富集分析,超炫的展示方式,TCGA也是他的粉丝
热度 1 ChengyangWang 2017-12-18 15:57
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome 作者:小哈 来源: 嘉因 文末有福利! 小伙伴儿看题目就猜到了 没错,小哈也是那个拽的不要不要的Y叔的粉丝。 上次发帖说 不懂生信,不装Linux,也能Run代码—Windows系统的Linux命令行工具Babun (此处有链接,点击查看),公开代码的国际项目之一就是著名的TCGA: TCGA Workflow: Analyze cancer genomics and epigenomics data using Bioconductor packages 发表在那个遍地是牛的F1000Research上。 打开全文一看,不得了,一共20幅图,其中3幅是用Y叔的ChIPseeker画的,占15%,原来TCGA里藏了Y叔的粉丝!!! TCGA用clusterProfiler转换了注释ID TCGA用ChIPseeker画了这3幅图 审稿人圈儿里力推的最靠谱富集分析工具——clusterProfiler 居然也是Y叔写的! 拜服! 它能画出这种图 为啥说它做富集分析最靠谱呢? 1. 算法最靠谱。 看哪个通路是否富集,需要卡P值,P值的计算是关键。 clusterProfiler做富集分析用的是基于差异基因列表的超几何分布,同时支持GSEA这种全表达谱分析的算法。 详见Y叔对比帖: Comparison of clusterProfiler and GSEA-P 用超几何分布算法计算P值需要基因注释信息、候选基因列表和背景基因列表。 通俗的讲 ,如果参与某一通路的基因在候选基因(差异表达基因)列表里占的比例很大,而在背景基因(整个基因组)列表中占的比例很小,那么这个通路在候选基因列表中就是富集的。这两个比例相差越多,P值越低。 clusterProfiler用基因组中有注释的基因做背景基因列表; 有的工具 用基因组上所有的基因做背景,无注释的基因也算在内。 详见Y叔吐槽帖: why clusterProfiler fails 如果追求低P值,觉得P值很低很低才好看,那就用后者; 如果追求真理,就用clusterProfiler; 审稿人追求哪种呢? 2. 注释最全,注释最新。 最全 。clusterProfiler支持GO、KEGG、MSigDB、DAVID、DOSE, meshes,ReactomePA,还支持用户自己的注释数据。 怪不得TCGA用clusterProfiler来转换注释ID呢! 引用Y叔公众号里的一个例子: GO注释 KEGG注释 最新 。2012年开始,KEGG对数据库下载收费,大量的工具使用的都是2012年以前的数据。所幸KEGG的在线检索一直是免费的,clusterProfiler使用的是在线检索http得到的最新数据。 掐指一算, clusterProfiler得到的富集分析结果领先同行整整五年 。 让我们追忆一下五年来通路中的研究进展。。。 3. 展示方式最符合生物人的逻辑分析习惯。 小哈最喜欢下面这种展示方式,各种treatment,上调的、下调的基因富集在哪些通路上,富集程度如何,对比,一目了然。 而且他用了红配蓝, 为什么高分文章喜欢红配蓝 (此处有链接) ?
个人分类: Chip-seq、ATAC-seq实验分析|8922 次阅读|1 个评论
[转载]ChIP-seq策略视频 | 由MACS作者张勇亲自讲述
ChengyangWang 2017-12-15 10:52
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome 作者:小丫 来源: 嘉因 做ChIP-seq数据分析的都知道MACS,作者Yong Zhang,Tao Liu et. al.。生信领域同一年毕业了四位叫Yong Zhang的博士,此Yong是哪一位?在 生信入门路 | 生物/医学人的生信启蒙 一文中,扒出了MACS作者的本科毕业院校和专业,现在是同济大学教授。据说有人追星追到同济去了,已经不需要小丫来扒。那我们就来听Yong扒一扒ChIP的发展史和分析策略,以及他近几年的研究工作。 Yong开场说: 生物信息是深度分析 ,什么不是深度分析呢?这次讲的都不是深度分析,这次讲的是常规的数据分析,常规的数据分析是做表观遗传的都该掌握的。 (做表观的都来认真听讲;假装做生信的假装没听见) ChIP-seq数据分析不像RNA-seq那样照着pipeline就能做,Yong的常用词tricky,最适合形容ChIP-seq。在这个视频中,Yong对ChIP-seq实验设计和数据分析中的tricky问题做了详细解答: 1. ChIP实验需要做重复吗? 需要3次生物学重复,多了更好。像这种比较难做的实验,不是做3次实验,而是要做到3个好的为止。 2. 测多深? 测多深都不够,总有新发现。 推荐转录因子或H3K4me3这种比较窄峰的Factor测20M; 像H3K27me3这种broad峰需要测多些~40M,H3K9me3这种测60-70M。 3. 需要做对照吗? 必须做。 4. 怎样评价抗体?什么样的数据代表ChIP实验是成功的? 有一系列质控(QC)评价指标: 在IGV里看原始read分布、查看已知位点; FRiP,评价抗体效率; Cross-correlation,适用于TF; 重复实验的一致性IDR; motif跟factor的match程度如何; sequence conservation,有功能的区域通常更保守。 5. 怎样找两个样品的差异? ChIP-seq两组样品之间总会有一些peak处于阈值附近。 应该这样做 :Call peak时,两组样品的cutoff有松有紧。A松B紧,找出的差异peak才是B special;反之,A紧B松,找出的差异peak是A special。 推荐定性分析差异peak。如果要定量分析,改进的实验方法iChIP更适合。 感谢“Epigenetics表观遗传学”公众号分享讲座视频,聆听更多大师讲座,请到文末点击方框中的Epigenetics表观遗传学。 下面转载视频 表观遗传系列视频15 | 同济大学张勇:ChIP-seq及DNA甲基化分析策略(附PPT) 原创 2017-09-06 Epiview 去年 8 月,「表观基因组学暑期国际讲习班」于复旦大学召开。大会邀请了国内外表观基因组学顶尖的学者,为学员们分享表观基因组学的最新进展。讲习班持续 10 天,积累了大量的视频教学资源,经过漫长整理,系列视频终于跟大家见面了。 今天分享第 15 期视频。其他系列视频将陆续发布,敬请持续关注。 主讲人简介: 张勇 博士,2001 年毕业于北京大学地球物理系,获学士学位。2006 年毕业于中国科学院生物物理研究所,获得博士学位。2006-2009 年,在美国哈佛大学和 Dana-Farber 癌症研究所从事博士后研究。自 2009 年起被聘为同济大学生命科学与技术学院教授。 主持多项基金委、科技部和上海市科研项目。在国内外学术期刊上发表论文六十余篇,文章总计被引用超过 5500 次,其中作为通讯作者在 Nature, Genome Research, Genome Biology, Cell Research, Nature Protocols, Nucleic Acids Research, Bioinformatics 等期刊发表论文 20 余篇。先后获得上海市科技启明星计划(2009年)、教育部新世纪优秀人才支持计划(2011年)、上海市科技“启明星”计划(跟踪)(2013年)、国家自然科学基金委优秀青年科学基金项目(2013年)、中组部“青年拔尖人才”(2015年)、中国干细胞学会“干细胞青年研究员奖”(2016年)、上海市优秀学科带头人(2017年)。目前担任 Genome Biology 期刊编辑委员会成员、中国细胞生物学学会功能基因组学与系统生物学分会委员、中国遗传学会青年委员会委员、中国生物工程学会计算生物学与生物信息学专业委员会委员、中国细胞生物学学会染色质生物学分会委员。 研究方向 :针对高通量生物学数据,以发展生物信息学方法为核心,从核小体定位、组蛋白修饰、DNA甲基化等不同表观遗传层面,研究胚胎发育及干细胞分化中的表观遗传预编程机制。主要研究成果可以归纳成为三个方面:开发了包括 MACS 方法(被引用超过2300次)在内的一系列高通量生物学数据分析方法;揭示了脊椎动物在胚胎发育早期的表观遗传组建立过程及其与基因转录激活的关联;揭示了胚胎干细胞的表观遗传调控新机制。 演讲主题 : ChIP-seq 及 DNA 甲基化分析策略 基因剪接的生物学意义与检测 ChIP-seq 常用分析策略及问题分析 ChIP-seq 分析优化及标准化 全基因组 DNA 甲基化分析策略及问题解析 ▲ ChIP-seq 及 DNA 甲基化分析策略(2h 33min) PPT 获取: 在后台回复“ ZY ”,即可获得本讲PPT下载链接。 特别声明: 本系列视频版权归复旦大学表观基因组学暑期国际讲习班组委会所有,不得用于任何商业用途。
个人分类: Chip-seq|2108 次阅读|0 个评论
[转载]ChIP-seq不画出这样的结果图,哪好意思说自己是做生信的
ChengyangWang 2017-12-13 15:04
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome 作者:小哈 来源: 嘉因 ChIP-seq能回答哪些生物学问题? 找到转录因子调控的靶基因; 发现转录因子的 collaborator; 发现转录因子的新的调控机制,例如SETDB1,详见 一篇运用ChIP-seq研究组蛋白修饰位点的文献 发现新的调控元件,例如,用H3K27ac和Med1的ChIP-seq鉴定新的super enhancer、组织特异性enhancer; 与转录因子激活/KD/KO样品的RNA-seq数据一同分析,结果更精确, 详见 ChIP-seq和RNA-seq整合分析,BETA最擅长 ; 如何实现ChIP-seq的这些功能呢? 需要懂ChIP-seq的人进行专业的数据分析与挖掘 分析方案 ChIP-seq数据的质量控制 数据相关度的统计 对于有重复的数据,数据相关度的统计可以作为质量控制的手段。 结合位点的检测 利用国际主流的MACS工具来确定结合位点的位置,即call peak。 结合位点在基因附近的特征分析 统计在基因转录起始位点,转录终止位点,上下游区域附近的平均强度 结合位点的分布/进化特征分析 统计结合位点在不同的基因注释区域的富集程度,评估其进化保守性。 挖掘生物学特征 转录因子的motif分析 与某类蛋白质高亲和度的特定碱基序列称为motif,利用MDScan的算法发现新的motif,同时用各大数据库已有的motif数据注释转录因子结合位点。 结合位点的靶基因预测 根据转录因子的结合位点与基因的转录起始位点之间的距离来定量估计转录因子对靶基因的调控潜能。 靶基因调控机制分析 结合RNA-seq数据与ChIP-seq数据,推测转录因子的激活/抑制作用,以及被激活和被抑制的靶基因。 结合模式的热图聚类 根据组蛋白修饰和转录因子在某一转录因子结合位点附近的结合信号,进行聚类分析,推测转录因子的作用机制。 数据关联度的统计 结合大规模ChIP-seq公共数据,进行数据关联度统计,有助于找到 相互间协同作用的转录因子 。 结合位点附近的热图分析 根据转录因子的DNA结合强度信号值,从高到低排列,平行画出其他调控因子或组蛋白修饰结合信号。有助于从全基因组角度,了解转录因子或组蛋白修饰之间的关系。
个人分类: Chip-seq|3025 次阅读|0 个评论
[转载]ChIP实验,这家公司做的怎么样?有图有真相
ChengyangWang 2017-12-13 14:41
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome 作者:小丫 来源: 嘉因 ChIP-seq技术服务,重点在于能做好ChIP实验,既能做组蛋白修饰,又能做 转录因子,这样的服务哪里找? 上海嘉因生物科技有限公司 嘉因生物做过哪些factor的ChIP实验呢? 质量如何? 小丫将ChIP-seq项目中,由 嘉因生物做ChIP实验 的数据 进行了汇总。 未包含ChIP-qPCR项目。 做过哪些Factor? 各种组蛋白修饰、转录因子、Pol II、带flag标签的转录因子、CTCF等等。 组蛋白修饰里面H3K27ac做的最多,火爆的super enhancer! !! 其次是经典的H3K4me2和H3K27me3。 组蛋白修饰里面H3K27ac做的最多,火爆的super enhancer! !! 其次是经典的H3K4me2和H3K27me3。 组蛋白修饰里面H3K27ac做的最多,火爆的super enhancer! !! 其次是经典的H3K4me2和H3K27me3。 组蛋白修饰里面H3K27ac做的最多,火爆的super enhancer! !! 其次是经典的H3K4me2和H3K27me3。 做过哪些样品? 样品类型有人的细胞、组织, 也有小鼠和其他物种来源的样品。 谁来找嘉因做ChIP? 来自高校的项目最多,其次是医院。 上海本地的项目最多 做了这么多,质量怎么样啊? 一、质量的总体分布 Mapping率怎么样? 找出了多少peak? 二、几个例子 最直观的是用眼睛看原始数据。 用IGV打开bigwig文件,zoom in,从基因组上随便点开一个区域。 能不能一眼看到峰? factor结合位点的峰sharp不? 周围noise多不多? 转录因子名字涉及到客户隐私,下文用TF1、TF2代替。 把每个基因TSS附近的ChIP信号都画出来。 是否符合这些factor各自的分布规律? 把每个基因TSS附近的ChIP信号都画出来。 是否符合这些factor各自的分布规律? 画出factor在基因body区域的平均分布。 是否make sense? 单看TSS上下游区域 看到H3K4me3在TSS两侧漂亮的山谷图形了吗? H3K27ac也有个漂亮的坑哦! 顺便看看TTS附近 丑丑的小坑 各Factor在基因组功能区域上的分布情况 小丫总结完,底气十足的跟销售讲: 凭这数据质量,你们就使劲儿拉单子吧! ChIP-seq相关干货帖: 哪个TF会来结合我这段DNA 转录因子调控哪些下游基因,有实验证据的线索 药物处理多久后能看到组蛋白修饰的变化? 组蛋白修饰预示着什么?
个人分类: Chip-seq|2728 次阅读|0 个评论
[转载]组蛋白修饰预示着什么?
热度 1 ChengyangWang 2017-12-13 13:25
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome 作者:小丫 来源: 嘉因 今天尹师妹听了个报告,用H3K4me3标记lncRNA的转录起始位点,貌似很神奇的样子。 各种组蛋白修饰都有什么意义呢? 有标记转录激活、沉默、转录抑制的,还有标记染色质组装、DNA损伤修复、有丝分裂、减数分裂和细胞凋亡的,文后附表 。 下图形象的画出了各种组蛋白修饰在基因上的分布。 转录活跃的基因 外界信号经过一系列信号转导通路激活核内激酶,磷酸化组蛋白和转录因子,从而启动下游生理应答。转录因子结合到启动子区的DNA上,促使RNA PolII结合上来,起始转录。活跃转录基因启动子附近的核小体富含活跃的组蛋白修饰,例如H3K4的乙酰化和甲基化。在 转录起始位点,有一个核小体缺失 区域(nucleosome depleted region,NDR)。转录延伸中的RNA PolII,其C端被高度磷酸化,与组蛋白修饰酶相互作用,例如Set2,使得H3K36发生甲基化,从而在 转录延伸的DNA区段加上H3K36me3标记 。另外,在转录活跃基因的转录区域,还会加上 H3K79甲基化 修饰。 转录抑制的基因 转录抑制状态下的基因区域,富含沉默的组蛋白修饰,例如 H3K9甲基化和H4K20甲基化 。其 启动子区域富含H3K27甲基化 。这些修饰区域被异染色质蛋白包裹,例如PRC1,从而形成高密度的染色质区域,即异染色质。 总结如下表: lysine ,Arg ,Ser ,Thr ,Tyr Acetylation Histone Site Histone-modifying Enzymes Proposed Function Ref. # H2A Lys4 (S. cerevisiae) Esa1 transcriptional activation (1) Lys 5 (mammals) Tip60 , p300/CBP transcriptional activation 2 , 3 ) Lys7 (S. cerevisiae) Hat1 unknown (4) Esa1 transcriptional activation (1) H2B Lys5 p300 , ATF2 transcriptional activation ( 5 , 3 ) Lys11 (S. cerevisiae) Gcn5 transcriptional activation (6) Lys12 (mammals) p300/CBP , ATF2 transcriptional activation ( 5 , 3 ) Lys15 (mammals) p300/CBP , ATF2 transcriptional activation ( 5 , 3 ) Lys16 (S. cerevisiae) Gcn5, Esa1 transcriptional activation (6) Lys20 p300 transcriptional activation (3) H3 Lys4 (S. cerevisiae) Esa1 transcriptional activation (1) Hpa2 unknown (7) Lys9 unknown histone deposition (8) Gcn5 , SRC-1 transcriptional activation (10 , 9) Lys14 unknown histone deposition (8) Gcn5 , PCAF transcriptional activation (11 , 3) Esa1, Tip60 transcriptional activation ( 2 , 1 ) DNA repair (11,12) SRC-1 transcriptional activation (10) Elp3 transcriptional activation (elongation) (13) Hpa2 unknown (7) hTFIIIC90 RNA polymerase III transcription (14) TAF1 RNA polymerase II transcription (15) Sas2 euchromatin (16) Sas3 transcriptional activation (elongation) (17) p300 transcriptional activation (3) Lys18 Gcn5 transcriptional activation, DNA repair (9) p300/CBP DNA replication, transcriptional activation (18 , 3) Lys23 unknown histone deposition (8) Gcn5 transcriptional activation, DNA repair (9) Sas3 transcriptional activation (elongation) (17) p300/CBP transcriptional activation (18 , 3) Lys27 Gcn5 transcriptional activation (6) Lys36 Gcn5 transcriptional activation (82) Lys56 (S. cerevisiae) Spt10 transcriptional activation (19) DNA repair (20) H4 Lys5 Hat1 histone deposition (21) Esa1, Tip60 transcriptional activation ( 2 , 1 ) DNA repair (11,12) ATF2 transcriptional activation (5) Hpa2 unknown (7) p300 transcriptional activation (3) Lys8 Gcn5 , PCAF transcriptional activation (22 , 3) Esa1, Tip60 transcriptional activation ( 2 , 1 ) DNA repair (11,12) ATF2 transcriptional activation (5) Elp3 transcriptional activation (elongation) (13) p300 transcriptional activation (3) Lys12 Hat1 histone deposition (21) telomeric silencing (23) Esa1, Tip60 transcriptional activation ( 2 , 1 ) DNA repair (11,12) Hpa2 unknown (7) p300 transcriptional activation (3) Lys16 Gcn15 transcriptional activation (22) MOF (D. melanogaster) transcriptional activation (24) Esa1, Tip60 transcriptional activation ( 2 , 1 ) DNA repair (11,12) ATF2 transcriptional activation (5) Sas2 euchromatin ( 6 , 2 ) Lys91 (S. cerevisiae) Hat1/Hat2 chromatin assembly (25) Methylation Histone Site Histone-modifying Enzymes Proposed Function Ref. # H1 Lys26 Ezh2 transcriptional silencing ( 48 , 49 ) H2A Arg3 PRMT1/6 , PRMT5/7 transcriptional activation, transcriptional repression (83) H3 Arg2 PRMT5 , PRMT6 transcriptional repression (83) Arg8 PRMT5 , PRMT2/6 transcriptional activation, transcriptional repression ( 31 , 88 ) Arg17 CARM1 transcriptional activation (18) Arg26 CARM1 transcriptional activation (83) Arg42 CARM1 transcriptional activation (89) Lys4 Set1 (S. cerevisiae) permissive euchromatin (di-Me) (26) Set 7/9 (vertebrates) transcriptional activation (tri-Me) (27) MLL , ALL-1 transcriptional activation ( 28 , 29 ) Ash1 (D. melanogaster) transcriptional activation (30) Lys9 Suv39h , Clr4 transcriptional silencing (tri-Me) ( 32 , 33 ) G9a transcriptional repression genomic imprinting (34) SETDB1 transcriptional repression (tri-Me) (35) Dim-5 (N. crassa) , Kryptonite (A. thaliana) DNA methylation (tri-Me) ( 36 , 37 ) Ash1 (D. melanogaster) transcriptional activation (30) Lys27 Ezh2 transcriptional silencing (38) X inactivation (tri-Me) G9a transcriptional silencing (34) Lys36 Set2 transcriptional activation (elongation) (39) Lys79 Dot1 euchromatin (40) transcriptional activation (elongation) (41) checkpoint response (42) H4 Arg3 PRMT1/6 transcriptional activation (43) PRMT5/7 transcriptional repression (31) Lys20 PR-Set7 transcriptional silencing (mono-Me) (44) Suv4-20h heterochromatin (tri-Me) (45) Ash1 (D. melanogaster) transcriptional activation (30) Set9 (S. pombe) checkpoint response (46) Lys59 unknown transcriptional silencing (47) Phosphorylation Histone Site Histone-modifying Enzymes Proposed Function Ref. # H1 Ser27 unknown transcriptional activation, chromatin decondensation ( 48 , 49 ) H2A Ser1 unknown mitosis, chromatin assembly ( 50 ) MSK1 transcriptional repression ( 51 ) Ser122 (S. cerevisiae) unknown DNA repair ( 53 ) Ser129 (S. cerevisiae) Mec1, Tel1 DNA repair ( 54 , 55 ) Ser139 (mammalian H2A.X) ATR, ATM , DNA-PK DNA repair ( 56-58 ) Thr119 (D. melanogaster) NHK1 mitosis ( 52 ) Thr120 (mammals) Bub1 , VprBP mitosis, transcriptional repression ( 90 , 91 ) Thr142 (mammalian H2A.X) WSTF apoptosis, DNA repair ( 92 ) H2B Ser10 (S. cerevisiae) Ste20 apoptosis ( 59 ) Ser14 (vertebrates) Mst1 apoptosis ( 60 ) unknown DNA repair ( 61 ) Ser33 (D. melanogaster) TAF1 transcriptional activation ( 62 ) Ser36 AMPK transcriptional activation ( 84 ) H3 Ser10 Aurora-B kinase mitosis, meiosis ( 64 , 65 ) MSK1 , MSK2 immediate-early gene activation ( 66 ) IKK-α transcriptional activation ( 67 ) Snf1 transcriptional activation ( 68 ) Ser28 (mammals) Aurora-B kinase mitosis ( 70 ) MSK1 , MSK2 immediate-early activation ( 66 , 71 ) Thr3 Haspin/Gsg2 mitosis ( 63 ) Thr6 PKCβI ( 85 ) Thr11 (mammals) Dlk/Zip mitosis ( 69 ) Tyr41 JAK2 transcriptional activation ( 86 ) Tyr45 PKCδ apoptosis ( 87 ) H4 CK2 unknown mitosis, chromatin assembly ( 50 ) CK2 DNA repair ( 72 ) Ubiquitylation Histone Site Histone-modifying Enzymes Proposed Function Ref. # H2A Lys119 (mammals) Ring2 spermatogenesis ( 73 ) H2B Lys120 (mammals) UbcH6 meiosis ( 74 ) Lys123 (S. cerevisiae) Rad6 transcriptional activation ( 75 ) euchromatin Sumoylation Histone Site Histone-modifying Enzymes Proposed Function Ref. # H2A Lys126 (S. cerevisiae) Ubc9 transcriptional repression ( 76 ) H2B Lys6 or Lys7 (S. cerevisiae) Ubc9 transcriptional repression ( 76 ) H4 N-terminal tail (S. cerevisiae) Ubc9 transcriptional repression ( 77 ) Biotinylation Histone Site Histone-modifying Enzymes Proposed Function Ref. # H2A Lys9 biotinidase unknown ( 78 ) Lys13 biotinidase unknown ( 78 ) H3 Lys4 biotinidase gene expression ( 79 ) Lys9 biotinidase gene expression ( 79 ) Lys18 biotinidase gene expression ( 79 ) H4 Lys12 biotinidase DNA damage response ( 80 , 81 ) would like to thank Prof. Craig Peterson, University of Massachusetts Medical School, Worcester, Massachusetts, for reviewing this table. - See more at: http://www.cellsignal.com/common/content/content.jsp?id=science-tables-histone#sthash.AecDp5zJ.dpuf 表格来源:http://www.cellsignal.com/common/content/content.jsp?id=science-tables-histone 长按二维码关注我们。
个人分类: Chip-seq|3131 次阅读|1 个评论
ChIP-seq 数据分析
热度 1 lchanlon 2016-1-19 08:31
利用R/Bioconductor 软件包“chipseq” 和“Gviz”对蛋白的结合位点进行分析和显示。 # loading ‘chipseq‘and ‘Gviz‘ library(chipseq) library(Gviz) # Load alignedchipseq reads sample ‘cstest’ to workspace. data(cstest) #use namesfunction to see samples included in ‘cstest’ #two sample inthis dataset—‘ctcf’ and ‘gfp’ names(cstest) ctcf gfp # display thedata of cstest dataset cstest GRangesList oflength 2: $ctcf GRanges with450096 ranges and 0 metadata columns: seqnames ranges strand Rle IRanges Rle chr10 + chr10 + chr10 + chr10 + chr10 + ... ... ... ... chr12 - chr12 - chr12 - chr12 - chr12 - ... 1 moreelement --- seqlengths: chr1 chr2 ... chrY_randomchrUn_random 197195432 181748087 ... 58682461 5900358 # Get ‘ctcf’data for further analysis ctcf- cstest$ctcf # display thedata of ctcf ctcf GRanges with450096 ranges and 0 metadata columns: seqnames ranges strand Rle IRanges Rle chr10 + chr10 + chr10 + chr10 + chr10 + ... ... ... ... chr12 - chr12 - chr12 - chr12 - chr12 - --- seqlengths: chr1 chr2 ... chrY_randomchrUn_random 197195432 181748087 ... 58682461 5900358 #calculate coverage of ctcf ctcf.cov- coverage(ctcf) #get theisland of ctcf at chromosome 10 island- slice (ctcf.cov$chr10, lower=1) #display theisland range range(width(island)) 24371 # get thelargest island in binding region largeisland - island #display thelargest island information largeisland Views on a129993255-length Rle subject views: start end width 6747584067476210 371 # get thetrack information of largest island in chromosome 10 including 5000 bp upstreamof largest island and 5000 bp downstream of largest island chiptrack- window (ctcf.cov$chr10, start=start(largeisland) - 5000,end=end(largeisland) + 5000) #display theinformation of track chiptrack integer-Rle oflength 371 with 99 runs Lengths: 17 7 5 6 6 12 5 1 11 5 9 7 ... 7 5 23 1 6 5 10 2 1 1110 Values: 1 2 1 2 3 2 1 2 1 2 3 4 ... 3 2 1 2 3 2 3 4 3 2 1 #transform theRLE format data to numeric format data chiptrack- as.numeric (chiptrack) #prepare DataTrack of this island for track ploting genome - hg19 dtrack- DataTrack (data=chiptrack, start=(start(largeisland)-5000):(end(largeisland) +5000), end=(start(largeisland)-5000):(end(largeisland) +5000), chromosome=chr10, genome=genome,name=Density, background.title=brown, cex.title=1.2, background.title=white,fontcolor.title=darkblue, col.axis=darkblue,cex.axis=1) #prepare ideogramTrack of chromosome 10, human hg19 genome itrack- IdeogramTrack (genome=genome, chromosome=chr10) #prepare GenomeAxisTrack atrack- GenomeAxisTrack () # plot the tracks of largest binding domain of ctcf at chromosome 10 plotTracks(list(itrack,atrack, dtrack), type=histogram,col.histogram=red, fill.histogram=red ) plotting result:
个人分类: R/Bioconductor|7468 次阅读|3 个评论
[转载]chip-chip和chip-seq
liujd 2014-6-4 19:00
一、chip-chip 染色质免疫共沉淀技术(ChIP)及与芯片方法的结合 染色质免疫共沉淀-芯片(Chromatin Immunoprecipitation –chip,ChIP-chip),它的基本原理是在生理状态下把细胞内的蛋白质和DNA交联在一起,超声波将其打碎为一定长度范围内的染色质小片段,然后通过所要研究的目的蛋白质特异性抗体沉淀此复合体,特异性地富集目的蛋白结合的DNA片段,通过对目的片断的纯化与检测,从而获得蛋白质与DNA相互作用的信息。ChIP与基因芯片相结合建立的ChIP-chip方法已广泛用于特定反式因子靶基因的高通量筛选;ChIP与体内足迹法相结合,用于寻找反式因子的体内结合位点;RNA-CHIP用于研究RNA在基因表达调控中的作用。它与DNA芯片和分子克隆技术相结合,可用于高通量的筛选已知蛋白质分析的未知DNA靶点和研究反式作用因子在整个基因组上的分布情况。染色质免疫共沉淀技术与芯片技术相结合更有助于科学家发明疾病的有效治疗方法。调控蛋白与基因组DNA结合能够控制DNA复制和基因表达,作为细胞调节网络中的开关,结合位点分析信息与基因表达数据相结合,将能有助于分析寻找生物标志物(biomarker)。转录因子通过与核酸直接的相互作用等方式在细胞内发挥着重要的转录调控作用。它们通常序列特异性地结合在基因转录起始位点上游的启动子区来调节该基因的转录。而ASB的启动子芯片技术则是用于检测单个转录因子在细胞中的某一时刻与20,000个基因启动子相互作用的情况。通过染色质免疫共沉淀(ChIP)技术和启动子芯片的有机结合,可以确定任何一个特定转录因子的靶基因群。 ChIP-chip技术对于大规模挖掘顺式调控信息成绩卓著,同时它可以用于胚胎干细胞和一些疾病如癌症、心血管疾病和中央神经紊乱的发生的机制。研究人员还可以利用这项技术开发一些治疗方法。目前ChIP-chip技术研究主要集中于两个领域:及转录因子的结合和条件特异性;组蛋白的修饰,组蛋白修饰蛋白和染色体重建。ChIP-chip 在描述转录结合因子动力学中的研究、染色体结构组分的分布、在组蛋白的修饰、组蛋白修饰蛋白和染色体重建中的应用也十分广泛。ChIP-chip 技术的优点是,可以在体内进行反应;在给定的检验细胞环境的模式下得到DNA相互关系的简单影像;使用特异性修正抗体鉴定与包含有一个特异性后转录修正的蛋白质的相关位点;直接或者间接(通过蛋白质与蛋白质的相互作用)的鉴别基因组与蛋白质的相关位点。缺点是:需要一个特异性蛋白质抗体,有时难于获得;为了获得高丰度的结合片段,必须实验演示胞内条件下靶标蛋白质的表达情况;调控蛋白质的基因的获取可能需要限制在组织来源中。总之,ChIP-chip 技术的发展为析活细胞或组织中DNA与蛋白质的相互关系提供了一个极为有力的工具。在未来的研究中,将对芯片的构建进行改进,提高其实用性。使用易于获得抗体,增加这种方法的可用性。 二、chip-seq 染色质免疫共沉淀技术(Chromatin Immunoprecipitation,ChIP)也称结合位点分析法,是研究体内蛋白质与DNA相互作用的有力工具,通常用于转录因子结合位点或组蛋白特异性修饰位点的研究。将ChIP与第二代测序技术相结合的ChIP-Seq技术,能够高效地在全基因组范围内检测与组蛋白、转录因子等互作的DNA区段。 ChIP-Seq的原理是:首先通过染色质免疫共沉淀技术(ChIP)特异性地富集目的蛋白结合的DNA片段,并对其进行纯化与文库构建;然后对富集得到的DNA片段进行高通量测序。研究人员通过将获得的数百万条序列标签精确定位到基因组上,从而获得全基因组范围内与组蛋白、转录因子等互作的DNA区段信息。
个人分类: 生物信息|0 个评论
下一代测序中ChIP-seq数据的处理与分析
热度 9 xiaohai2008 2012-5-4 10:29
将染色质免疫共沉淀技术(ChIP)与下一代高通量测序技术相结合的染色质免疫共沉淀测序(ChIP-seq),已成为功能基因组学、特别是基因表达调控领域研究的关键技术。ChIP-seq实验带来的海量数据向生物信息学研究人员提出了新的挑战。由于此领域数据处理技术的发展大大滞后于实验技术进步,有必要系统地介绍和回顾ChIP-seq数据处理的各个方面,以便更多研究人员进入此领域设计或改进相应的算法。文章结合实例详细介绍了ChIP-seq数据整个流程,并重点讨论了其的主要问题和关键环节,为这一研究领域的科研人员提供一个快速而深入的认识。 全文见: 下一代测序中ChIP-seq数据的处理与分析.pdf
个人分类: Bioinformatics|14583 次阅读|10 个评论
高通量测序中的一个read具有多个位点map上的现象的一些看法
TripleW 2012-1-8 16:57
很难避免,这种现象,高通量产生的数据中,有部分在基因组上有多个map质量是一样好的现象,这往往是基因组中重复区域造成的。 而这个往往researchers采取了抛弃处理,但是如果我们仔细想想,这种处理会造成哪些后果,我们是不是应该手下留情,进而进一步的慎重考虑对这部分序列采取什么样的后备方案。 看一下背景,这部分的reads,因所测得基因组不同而不同,对于基因组有大量的重复区域,这部分被抛弃的reads的比重将非常高,我没有查过拟南芥的重复区域占有的比重多少(如果您知道,请告诉我),但是我在map某个ChIP-seq数据到拟南芥基因组上的时候,发现有20%的是在基因组上有多个同等质量map位点的,而这部分序列都被抛弃掉了,在加上那些没有map到基因组上的,这样下来,就有近50%的reads被抛弃。用剩下的50%所做出的研究,虽然也许可能提高了研究的灵敏度,但是同时也忽略了大量的信息,甚至可能引入某些假阳性。 为什么可能会引入假阳性? 对于具有两个样本(一个实验组A,一个control组B)的实验研究,这样就会产生两套数据,各自align到基因组上的时候,就会分别出现各自上面说过的现象。假设,他们各自有20%的比率吧,如果这两者间的这些被抛弃的序列彼此都非常相近,我们可以想见,即使去掉了这部分序列,也无伤大雅,但是如果他们不是呢? 对于A组,这20%被抛弃的reads,假设这其中有10%的reads在B组中,只有一个最好map质量,那么在B组中就不会被抛弃,而是会会被保留下来;反之亦然,B组中的有10%如果再A组中的map只有一个最好的map位点,那么也将会被保留。这样下来,就会产生20%的差异(如果真是这样的情况出现,应该还不止)。 所以在基因组上具有多个位点所对应的reads,是不是应该被抛弃,就值得我们进一步的深思。。。。
个人分类: ChIP/RNA-seq|5173 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-19 12:20

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部