科学网

 找回密码
  注册

tag 标签: 转录调控

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

[转载]二型花柱分子调控机制研究新进展
luozhongl 2019-8-1 15:34
复杂的花部结构和多样的繁育系统是被子植物区别于其它植物类群的重要特征,也是其成为地球上最成功的植物类群的关键因素。长期以来,繁育系统的进化与适应机制是植物生物学与进化生物学研究的焦点。二型花柱 ( Distyly ) 是一种由遗传因素控制的花型多态现象,即同一种植物包含长花柱和短花柱两种花型的个体。目前在20余科的被子植物中发现了二型花柱。这一特殊的繁育系统式样早在达尔文时期就已引起研究者的广泛关注,由于其性状明显、遗传基础明确,是研究重要繁殖性状进化及其基因调控的理想体系。 报春花科( Primulaceae )是二型花柱研究的经典模式类群。基于遗传学实验,研究者曾提出二型花柱发育调控的“ S-locus ”超基因模型( diallelic supergene model )。近年在 Primula vulgaris 的研究发现, S 位点的两个基因, CYP(CYP734A50) 和 GLO 与花柱长度和花药高度的控制密切相关;同时其上下游的一些基因可能也参与了调控。然而目前 S 位点影响的基因表达和相关代谢通路还基本处于未知状态。最近,张奠湘课题组的赵中涛和罗中莱等研究人员以我国西南地区分布的迎阳报春( P. oreodoxa )为材料,结合 RNA 二代测序技术和共表达网络分析( WGCNA ),首次揭示了二型花柱发育过程中分子调控的复杂性,并发现了参与控制花柱发育的新的关键候选基因。分析结果表明,一些参与植物激素信号通路的重要转录因子与 CYP734A50 在共表达模块中密切相联。本研究成果不仅为研究二型花柱的分子机制提供了新的视角,对于进一步探索花柱异型性的进化意义和生物学功能同样具有重要科学价值。 研究结果以“ Global transcriptome and gene co-expression network analyses on the development of distyly in Primula oreodoxa ”为题发表在 Nature 出版集团旗下的遗传学经典刊物 Heredity ( 作者:赵中涛,罗中莱,袁帅,梅丽娜,张奠湘 ) 。论文连接: https://www.nature.com/articles/s41437-019-0250-y 。 图 1 :迎阳报春( P rimula oreodoxa )长柱花(左图)与短柱花(右图)。 图 2 :模块与性状(花柱长度)相关性( A )及 GO term 富集分析( B 、 C )。 图 3 :柱长发育调节关键基因 CYP734A50 的共表达网络分析。 A. 与 CYP734A50 直接或间接相联的基因,包括转录因子(红色)、生长素( Auxin )代谢相关基因(绿色)、油菜素内酯( brassinosteroids )代谢相关基因(黄色)、细胞分裂素( cytokinin )代谢相关基因(深蓝色)及赤霉素( gibberellin )代谢相关基因(紫色)。 B. 与 CYP734A50 直接相联的基因。
个人分类: 研究进展|2298 次阅读|0 个评论
用别人的数据发自己的Science | 给你的文章加5分
ChengyangWang 2018-3-7 09:55
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome 作者:小丫来源: 嘉因 文中有【彩蛋】脑补2016年一篇Science paper作者的心路历程: MYC regulates the antitumor immune response through CD47 and PD-L1, Science , 2016. 我对 PD-L1、CD47 感兴趣,想知道 它们受哪个转录因子调控 。 Fig. S1 A. Two key immune regulatory proteins expressed on the cell surface of tumor cells, CD47 and PD-L1, and the immune cells that recognize them. 用《 他中了国自然,因为最后一周补了这张图 》的方法,获得了两个list,list 1 是 结合 PD-L1启动子的转录因子 ,list 2 是 结合 CD47启动子 的转录因子,取交集,发现 MYC既结合 PD-L1又结合CD47 ,如下图,这样我就 把免疫通路跟癌症通路联系起来了!!! ChIP-seq数据提示:MYC结合在CD47和PD-L1的启动子上 Fig. 2 C. ChIP-seq analysis of MYC binding to the promoter sequence of the genes encoding CD47 and PD-L1 in mouse MYC T-ALL cells. ChIP-sequencing traces were generated from GSE44672. 没错, 这套ChIP-seq是已发表的 。 有了这么重要的发现,Key Figure就出来了,进而 提出假说 : Fig. S17. MYC regulates the immune response against tumor cells via CD47 and PD-L1. Model demonstrating the regulation of immunological checkpoints in MYC-driven tumors. Following MYC inactivation, the expression of CD47 and PD-L1 is reduced, leading to an immune response and the subsequent induction of senescence and shutdown of angiogenesis 接下来,怎样设计方案,圆这个故事呢? 套路: 先用《 他中了国自然,因为最后一周补了这张图 》找到 关键 调控关系;作为文章的第二部分的 Key Figure ; 用R2 platform或TCGA的RNA-seq数据证实转录因子-靶基因的表达相关性《 TCGA,她已经用了七年 | 资深用户深度点评 》;补RT-qPCR和Western blot实验,从RNA和蛋白质水平证实转录因子对靶基因的调控作用;作为文章的第一部分; 有了上面两个方面的研究基础,你就相当有信心,确定转录因子直接调控了靶基因的转录。老板会非常乐意花钱做ChIP-seq或ChIP-qPCR,探索更多处理条件或发育阶段结合关系/强度的变化;作为文章的第三部分; 细胞实验、小鼠实验探讨转录因子和靶基因的功能;作为文章的第四部分; 众多5分文章做了第2和第4步,加上第1和第3步,立刻给你的文章加5分。 如何实现? 哪个转录因子调控我的基因?嘉因表观小助手帮你实现,72h交付结果,微信ID:epigenomics; 基因表达相关性分析,跟着嘉因公众号的帖子学着做; ChIP-seq,从ChIP实验、测序到多种数据整合分析和挖掘,嘉因生物帮你实现; 常规细胞生物学和分子生物学实验,包括细胞培养、过表达和敲降、肿瘤生长实验、小动物成像分析、RNA提取和RT-qPCR、流式分析、免疫组化;如果这些你也做不了,让我想想; 转基因和基因敲除细胞、小鼠,模式生物平台帮你实现。 下面详细解读,跟作者学学实验方案的设计: 第一部分:用最简单的实验初步证实靶基因被MYC调控 (shRNA knockdown MYC,RT-qPCR ,R2 platform) 先借助Tet-off 白血病 转基因小鼠模型,可以人为控制MYC表达或不表达(ON或者OFF)。用RT-qPCR,证实MYC调控了CD47和PDL1的表达。 Fig. 1. MYC regulates the expression of CD47 and PD-L1 in murine and human leukemia and lymphomas 白血病是这样, 实体瘤里什么情况呢? 1. 先看Tet-off肝癌转基因小鼠模型,没有Tet-off模型也没关系,用 shRNAknockdown MYC或抑制剂处理的人肝癌细胞系HepG2、melanoma SKMEL28、非小细胞肺癌H1299,用RT-qPCR和流式分选的方法,证实了MYC对CD47和PDL1表达的影响。 Fig.2 A-B 2. 用R2 platform 挖掘已发表的human primary tumors基因表达数据。发现人HCC、肾癌、结肠癌中MYC与CD47和PD-L1的表达显著相关。 小丫想:用TCGA的RNA-seq数据也能得出相似的结论。可是,当我看到这句: R2 contains mRNA gene expression profiles for more than70.000 individual human samples ,TCGA也要自惭形秽了。R2是个超级强大的平台,不仅数据超级多,还能直接在线挖掘和可视化,由下图可见一斑,长按,识别二维码,直达R2网站。这是这篇Science paper里隐藏的【彩蛋】! 结论: 多种人类癌症类型里,MYC都调控了CD47和PD-L1的表达。 在小鼠肿瘤和人肿瘤细胞中,抑制MYC会导致CD47和PD-L1的mRNA和蛋白质水平降低。 Fig. 2. MYC regulates CD47 and PD-L1 expression in human and mouse tumors and binds to the promoters of the corresponding genes. 第二部分:用公共数据证实 MYC结合 靶基因 (ChIP-seq) 用RNA-seq或RT-qPCR看到了调控关系,直接调控?间接调控?傻傻分不清,要做ChIP才能in vivo证实直接结合。 别上来就自己做ChIP-seq,先查已发表的数据能不能用,这里有方法《 转录因子调控了谁?挖全天下所有高通量实验数据,只为您解决这一个问题 》。找到了2014年发表的两篇文章产生的MYC ChIP-seq数据 :Activation and repression by oncogenic MYC shape tumour-specific gene expression profiles. Nature 2014 Jul 24;511(7510):483-7. PMID:25043018;和BIM is the primary mediator of MYC-induced apoptosis in multiple solid tissues. Cell Rep 2014 Sep 11;8(5):1347-53. PMID:25176652 查看PD-L1和CD47、CD25等基因启动子区域的结合信号,画出开篇那个神图 Fig. 2 C和F ig. S7 and S8 。MYC对靶基因的调控有dosage-dependent specific effects。T-ALL和B cell line P493-6,MYC在CD47和PD-L1的启动子上有很强的结合信号,而在CD8a和CD25等基因的启动子上结合信号较弱。 结论: MYC直接结合CD47和PD-L1的启动子。 第三部分:in vivo,小鼠实验 作者2010年发现MYC inactivation in mouse tumor models results in recruitment of immune cells to the tumors。CD47和PD-L1在这一过程中起到什么作用呢? 结论: 小鼠肿瘤中MYC的失活导致CD47和PD-L1下调表达,增强了抗肿瘤免疫应答。 在强制表达CD47和PD-L1的肿瘤里,MYC的失活会抑制免疫应答,肿瘤继续生长。 MYC通过调控免疫调控分子来起始并维持了肿瘤发生。 Fig. 3. Constitutive expression of CD47 and PD-L1 in mouse MYC T-ALL 4188 cells prevents recruitment of immune effectors after MYC inactivation. Fig. 4. Down-regulation of CD47 or PD-L1 is required for tumor regression, shutdown of angiogenesis, and induction of senescence upon MYC inactivation. 扩展阅读: PD-L1发现者陈列平教授谈肿瘤免疫治疗 | CSCO2017年会感受 最后分享生物通对这篇paper的介绍,节选自http://www.ebiotrade.com/newsf/2016-3/2016310102749212.htm 这一研究发现第一次将肿瘤发生发展中的两个关键步骤: 失控的细胞生长与能够瞒骗意图阻止它的免疫分子 联系到了一起。当Myc突变或失调控时,可导致促进细胞分裂的蛋白质水平升高。 “不要吃我”与“别找我” 其中的一个分子是 CD47 蛋白,斯坦福大学Irving Weissman博士实验室的研究人员曾发现它作为“ 别吃我 ”信号,挡开了吞食癌症的免疫细胞——巨噬细胞。几乎所有人类癌症细胞都在其表面表达高水平的CD47,当前有一种CD47蛋白靶向性抗体已进入1期临床试验治疗各种人类癌症。 另外一个分子是称作为 PD-L1 的“ 别找我 ”蛋白,已知在癌症及免疫疾病过程中PD-L1抑制了免疫系统,但它也存在于正常妊娠过程中。PD-L1常在人类肿瘤细胞表面过表达。一种结合PD-L1的抗体已获得美国食品和药物管理局批准用于治疗膀胱癌的非小细胞肺癌,研究证实它可以有效地治疗许多癌症。 在癌症中,Myc是嫌疑犯 十多年来Felsher实验室的研究人员一直从事Myc蛋白研究。Myc是由癌基因编码。癌基因通常履行一些至关重要的细胞功能,当发生突变或错误表达时它们会变成强大的癌症促进者。在一半以上的人类癌症中都存在Myc癌基因突变或失调控。 尤其是,Felsher实验室一直在研究一种称作为癌基因成瘾的现象——它是指肿瘤细胞完全依赖于癌基因的表达。在这些情况下阻断Myc基因的表达,可使得动物体内的肿瘤完全消退。 在2010年,Felsher和同事们证实这种消退现象只发生在免疫健全的动物中,但却不清楚其原因。 关闭Myc的表达 Casey和Felsher决定看看,Myc表达与癌细胞表面CD47 和PD-L1蛋白水平之间是否存在关联。为此,他们调查了当关闭小鼠或人类肿瘤细胞中的Myc表达时发生的事情。他们发现Myc下降导致了小鼠和人类急性淋巴细胞白血病细胞、小鼠和人类肝癌细胞、人类皮肤癌细胞及人类非小细胞肺癌细胞表面CD47和PD-L1蛋白水平类似地下降。 在来自成百上千患者公开的肿瘤样本基因表达数据中,他们发现了Myc表达水平与肝脏、肾脏和大肠癌中CD47和PD-L1基因的表达水平密切相关。 随后研究人员直接检测了D47和PD-L1基因的调控区域。他们发现高水平的Myc蛋白直接结合了小鼠白血病细胞及人类骨癌细胞系中D47和PD-L1的启动子区域。他们还证实这种结合提高了人类血细胞系中的CD47基因表达。 可能的治疗协同作用 最后,Casey和Felsher改造小鼠白血病细胞不管Myc的表达状态持续表达CD47或PD-L1基因。相比对照细胞,这些细胞能够更好地躲避巨噬细胞和T细胞一类免疫细胞的检测,但不同于Felsher实验室以往的实验,当失活Myc表达时这些细胞生成的肿瘤并没有消退。 Felsher说,研究表明, 组合靶向Myc和CD47或PD-L1的治疗方法有可能通过减慢或终止肿瘤生长,并向免疫系统挥舞红旗来产生协同效应 。
个人分类: 生物paper|2937 次阅读|0 个评论
哪个转录因子调控你的基因?Plan C,不需要那么多ChIP-seq
热度 1 ChengyangWang 2018-2-23 10:49
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome 作者:小丫 来源: 嘉因 《 哪个蛋白质调控我感兴趣的基因? 》一文讲了找上游转录因子的三种策略: Plan A: 基于大量ChIP-seq公共数据挖掘 Plan B: motif分析预测 Plan C:DNase/ATAC-seq结合motif分析 如果您感兴趣的细胞类型样本很难收集,ChIP-seq数据特别少,没法实现Plan A,还有Plan C来帮你。 其实《 任意两组RNA-seq变身,国自然得AAA 》一文介绍的找关键转录因子的思路就应用了Plan C:先找差异DHS,再搜DHS上的motif,推测出决定两种状态差异的关键调控因子,用关键调控因子的ChIP-seq数据证实它的确结合在差异位点。 今天带你实现Plan C: 原理 用DNase/ATAC-seq找DHS 找DHS区域的motif 用ChIP-seq数据验证 结果展示 速查表 1. 原理 调控蛋白结合位点附近很容易被DNase I或Tn5酶切到,前者叫做DNase I hypersensitive site (DHS),后者叫做transposase-accessible chromatin,本文为方便叙述,把他们统称为DHS。 用DNase/ATAC-seq能够找出有调控蛋白结合的区域。怎样才能知道是哪个调控蛋白呢?DHS上存在大量的调控元件,查查看这上面存在哪些转录因子的motif,就能推测出该区域结合的调控蛋白是谁。 怎样验证推测出来的转录因子的确结合在这个位点呢?找这些转录因子的ChIP-seq数据,看看有没有peak,或者自己做ChIP-seq/qPCR。 跟DNase-seq比起来,ATAC-seq用的细胞数更少,500-50,000个细胞就能做,实验更稳定,需要做的话找嘉因。近两年各物种都在努力积累ATAC-seq数据: 做过ChIP-seq或ATAC-seq的物种速查 植物ATAC-seq文章和数据都在这里 水生生物的ATAC-seq数据和文章都在这里 果蝇ATAC-seq数据和文章都在这里 2. 用DNase/ATAC-seq找DHS ENCODE已产生860个DNase-seq和175个ATAC-seq数据,包括人、小鼠和果蝇,几十个tissue,几乎涵盖了人们感兴趣的细胞类型。具体是哪些tissue,到本文第6部分查找。 DNase/ATAC-seq数据的下载方法跟这篇的第5步一样:《 神技能!批量解决哪个转录因子调控你的基因 》 3. 找DHS区域的motif 找到了DHS,说明这个位置有调控因子结合,具体是谁呢?要扫motif。到JASPAR 2018下载motif文件,http://jaspar.genereg.net/downloads/。人、小鼠选Vertebrates,植物的选Plants,果蝇、蜜蜂选Insects,线虫选Nematodes,真菌,海鞘,各取所需。 怎样扫motif呢?这篇介绍的方法总有一款适合你《 点鼠标就能找启动子区的motif | meme-FIMO 》。 4. 用ChIP-seq数据验证 在DHS找到了几个转录因子的motif,它们不一定真的能够结合。我们用这些转录因子的ChIP-seq数据做验证,筛选出真的在这里有结合信号的转录因子。方法见这篇《 Plan A详细步骤1234 | 哪个转录因子调控我的基因? 》 5. 结果展示 展示方法类似于这张图《 他中了国自然,因为最后一周补了这张图 》,比它多个motif。举个栗子: 做植物的亲们,小丫这次找了个拟南芥的Plant physiology做例子,亲切吧! Liu, T.L., Newton, L., Liu, M.J., Shiu, S.H. and Farré, E.M., 2016. A G-box-like motif is necessary for transcriptional regulation by circadian pseudo-response regulators in Arabidopsis. Plant physiology, 170(1), pp.528-539. 6. 速查表 ENCODE产生的DNase/ATAC-seq数据,各tissue数据数量 人 81 kidney 74 musculature of body 70 skin of body 64 lung 60 connective tissue 59 epithelium 59 limb 50 intestine 44 brain 37 large intestine 34 heart 27 vasculature 26 blood 26 embryo 25 penis 24 stomach 21 blood vessel 21 extraembryonic component 18 mammary gland 18 ureter 14 adrenal gland 14 pancreas 14 small intestine 13 liver 13 placenta 12 bone element 11 uterus 10 gonad 10 thymus 9 artery 9 eye 9 prostate gland 8 esophagus 8 lymph node 7 lymphoid tissue 7 spinal cord 7 thyroid gland 6 skeleton 6 testis 5 ovary 4 adipose tissue 4 breast 4 mouth 4 nerve 3 spleen 2 bronchus 2 lymphatic vessel 2 tongue 2 vagina 2 vein 1 bone marrow 1 nose 1 trachea 1 urinary bladder 小鼠 40 brain 33 embryo 14 liver 11 heart 8 epithelium 8 limb 8 lung 7 kidney 6 intestine 5 eye 5 spleen 5 stomach 4 blood 4 connective tissue 3 lymph node 2 adipose tissue 2 bone element 2 bone marrow 2 spinal cord 2 thymus 1 breast 1 extraembryonic component 1 gonad 1 large intestine 1 musculature of body 果蝇 其他物种的ATAC-seq数据数量,看这篇《 做过ChIP-seq或ATAC-seq的物种速查 》 Organism Name 中文名 数量 Homo sapiens 人 6019 Mus musculus 小鼠 2223 Drosophila melanogaster 果蝇 122 Danio rerio 斑马鱼 25 Saccharomyces cerevisiae 酿酒酵母 23 Arabidopsis thaliana 拟南芥 23 Strongylocentrotus purpuratus 海胆 21 Oryza sativa 水稻 20 Caenorhabditis elegans 线虫 10 Capsaspora owczarzaki 变形虫 5 Schizosaccharomyces pombe 粟酒裂殖酵母 5 Streptococcus agalactiae 无乳链球菌 4 Sorghum bicolor 高粱 3 Solanum lycopersicum 番茄 2 Medicago truncatula 苜蓿 2 Oryza sativa Japonica Group 水稻 2 Setaria italica 小米 2 Zea mays 玉米 2 Zea mays subsp. mays 玉米 1 Branchiostoma lanceolatum 文昌鱼 1 Oryzias latipes 青鱂鱼 1
个人分类: 转录调控|8031 次阅读|1 个评论
国自然有这个图,谁敢说缺创新点
热度 1 ChengyangWang 2018-2-23 10:45
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome 作者:小丫 来源: 嘉因 出自http://ipp.jaas.ac.cn/Article/UploadFiles/201109/2011092817254731.ppt 新理论(新方法)研究新/老问题,小丫擅长,至少四颗星。 找哪个转录因子结合我的DNA,用ChIP-seq; 找哪个RBP结合我的RNA,用CLIP-seq/RIP-seq; 前者看转录水平调控,后者看转录后调控,两个层面挖调控机制,国自然研究就有了层次。 挖转录调控机制画这个图《 他中了国自然,因为最后一周补了这张图 》 挖转录后调控机制画这个图《 基于CLIP/RIP/RBNS公共数据研究转录后调控 》 CLIP-seq !足 够新!需为我所用 ! 翻新RNA-seq,画这个图《 RNA-seq这样画图,国自然必得A 》、《 任意两组RNA-seq变身,国自然得AAA 》,还要再补一篇RNA-seq不变身就能挖机制的图,抢先尝试,找嘉因小助手,微信ID:epigenomics。
个人分类: 自然NIH|3781 次阅读|1 个评论
国自然爱明星,拉你的基因进明星通路,一图搞定
ChengyangWang 2018-2-23 10:29
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome 作者:小丫 来源: 嘉因 明星人人爱,我家小汪也想跟明星攀亲戚。 这里有个 神图 看到明星通路中的小紫结合在小汪转录起始位点附近,推测小汪被小紫调控,从而参与这个明星通路,顺利带我家小汪进入明星大家庭。 原理 祖宗十八代,谁家没出过名人?只要你能连上线。 神 图 在 此 《 他中了国自然,因为最后一周补了这张图 》里的图,帮我的小汪FHL3找到好多上游转录因子,有GATA1、NFE2、TAL1等。借助它们,带小汪进入明星通路。 我怎么知道这些 转录因子参与哪个明星通路呢 ?要一个个搜文献吗?有办法。去Enrichr批量查询基因参与的pathway, http://amp.pharm.mssm.edu/Enrichr/ 点击第一行的Pathways。一眼扫过去,发现了IL-3、Notch、p73、c-MYB等pathway,妥妥的都是明星。 点击NCI-Nature 2016方块,再点击Clustergram。GATA1参与了Notch、p73、C-MYB通路。 点击PPI Hub Proteins,看到这三个转录因子怎样参与到蛋白质相互作用网络中。 接下来,设计生化实验验证GATA1、NFE2、TAL1对小汪FHL3的调控。妥妥的把我家小汪拉入明星通路大家庭: 神图是怎么画出来的? 《 哪个蛋白质调控我感兴趣的基因? 》一文讲了找上游转录因子的三种策略: Plan A:基于大量ChIP-seq公共数据挖掘 Plan B:motif分析预测 Plan C:ATAC-seq结合motif分析 ChIP系列 带你实现 Plan A 在线实现 Plan A详细步骤1234 | 哪个转录因子调控我的基因? 本地实现 神技能!批量解决哪个转录因子调控你的基因 小丫帮你实现 他中了国自然,因为最后一周补了这张图 motif系列 答疑帖一步步帮你实现 Plan B 去哪找motif? 史上最全物种转录因子、motif数据库footprintDB 这段DNA上有我关心的motif吗? 点鼠标就能找启动子区的motif | meme-FIMO motif scan结果怎样看? 互补链上的motif有意义吗? motif结果怎样展示到文章里? 找到了motif,怎样展示结果?
个人分类: 转录调控|3106 次阅读|0 个评论
他中了国自然,因为最后一周补了这张图
热度 1 ChengyangWang 2018-2-8 15:13
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome 作者:小丫 来源: 嘉因 国自然倒计时1个月,想挖机制,还想加个图,体现工作量,显得基础扎实,怎么办? 比如说基因已经做了功能研究,需要挖机制,完善故事;再比如说lncRNA KO/KD已经看出表型,可是找它调控了谁太难了。那咱换个思路, 往上找,找它受哪个转录因子调控,参与哪个明星通路 。 这种图既能 讲机制 ,又能在 短时间内画出来: c-fos基因附近有 多个enhancer , CBP、RNAPII、NPAS4结合在enhancer上 ,其结合强度跟细胞膜极性呈负相关。 出自例文一 Nature 2010 Widespread transcription at neuronal activity-regulated enhancers Greenberg Michael E., Kreiman Gabriel, Worley Paul F., Bito Haruhiko, Kuhl Dietmar, Markenscoff-Papadimitriou Eirene, Kuersten Scott, Barbara-Haley Kellie, Laptewicz Mike, Harmin David A., Wu Jing, Bear Daniel M., Costa Allen M., Gray Jesse M., Hemberg Martin and Kim Tae-Kyung 这种图能回答什么问题? 《 哪个蛋白质调控我感兴趣的基因? 》一文的Plan A,最后画的就是这样的结果图。它能 回答七个问题 : 您感兴趣的基因附近有哪些调控因子? 转录起始位点在哪? promoter在哪? enhancer在哪? 哪个enhancer最有可能调控我的基因? 哪些转录因子在promoter区调控转录? 哪些转录因子在enhancer区调控转录? 这种图能揭示什么机制? 基因附近多个位置有DNase/ATAC-seq的峰,推测这些位置有调控蛋白结合; 用H3K4me3和PolII的峰推测基因转录起始位点TSS的位置; TSS附近有转录因子ABC的峰,推测转录因子ABC结合在promoter,从而参与了基因X的转录调控; 用H3K27ac、EP300的峰推测基因附近存在enhancer; 用基因两侧CTCF的峰推测这一区域内enhancer上的转录因子参与调控基因X的可能性更大; Enhancer上有转录因子DEF的峰,推测转录因子DEF参与基因X的远距离调控。 这些调控因子的功能、它们在全基因组范围的分布规律,可回复“TF2”,用factorbook查看。 暂时不补实验,怎样完善故事? 表达相关性分析和生存分析,推测转录因子ABCDEF和基因X的原癌/抑癌作用,推测转录因子ABCDEF对基因的调控作用是激活/抑制,参考《 TCGA,她已经用了七年 | 资深用户深度点评 》 查文献,转录因子ABCDEF在某癌症中的功能、参与的pathway,最好能跟明星分子或明星通路联系起来,参考《 国自然、毕业论文、遗传咨询一站搞定 | 最全的研究进展COREMINE 》 怎样开展下一步实验 1. 不同处理条件下转录因子ABC的结合强度变化; 前面用别人的ChIP-seq发现了转录因子ABC结合在基因X附近,下面自己做ChIP-qPCR,查看多种treatment条件下转录因子ABC的结合强度变化,例如野生型和突变型的对比,药物处理前后的对比。 例文二 PLoS Genetics 2010 GC-Rich Sequence Elements Recruit PRC2 in Mammalian ES Cells Madhani Hiten D., Bernstein Bradley E., Ku Manching, Chi Andrew S., Issac Biju, Zhou Vicky W., Truong Thanh, Koche Richard P. and Mendenhall Eric M. 2. 转录因子AB对同一通路其他重要基因的调控; 前面发现了基因X上游有转录因子ABCDEF结合,推测他们调控了基因X的转录。接下来通过查文献,选两个重要的转录因子AB做ChIP-seq,同时结合 motif分析 ,找到同一通路中,也被转录因子AB调控的其他重要基因,一起讲个Big story。 例文三 Nature 2012 Regulation of Circadian Behavior and Metabolism by Rev-erbα and Rev-erbβ Evans Ronald M., Panda Satchidananda, Downes Michael, Auwerx Johan, Liddle Christopher, Glass Christopher K., Atkins Annette R., DiTacchio Luciano, Chong Ling-Wa, Lam Michael T., Barish Grant D., Yu Ruth T., Hatori Megumi, Zhao Xuan and Cho Han 3. 位于enhancer区域的转录因子DEF对基因X的远距离调控的验证; 发现了enhancer,也找到enhancer上结合了哪些TF,就要问:这个enhancer调控的是基因X吗?用3C实验验证enhancer调控了基因X。 例文四 Nature 2010 Mediator and Cohesin Connect Gene Expression and Chromatin Architecture Young Richard A., Dekker Job, Taatjes Dylan J., Levine Stuart S., Rahl Peter B., Goossens Jesse, Ebmeier Christopher C., van Berkum Nynke L., Orlando David A., Zhan Ye, Bilodeau Steve, Newman Jamie J. and Kagey Michael H. 怎么画 这图 ? 看过1-6步,就能画出这样的神图: 原理 在线快速查看结果 局限性 速查表 从哪里下载数据 怎样批量处理数据 怎样展示结果 《 Plan A详细步骤1234 》详细描述了1234; 《 Plan A详细步骤56 》详细描述了56; 本文解答了第7步。 小丫画的图长啥样? 例文五 Nature biotechnology 2010 Transcript assembly and abundance estimation from RNA-Seq reveals thousands of new transcripts and switching among isoforms Pachter Lior, Wold Barbara J., Salzberg Steven L., van Baren Marijke J., Kwan Gordon, Mortazavi Ali, Pertea Geo, Williams Brian A. and Trapnell Cole 作者认为Fhl3有个 新的isoform(黄色) ,位于 RefSeq isoform(蓝色) 的第一个intron里。TAF1和PolII ChIP-seq的峰支持了Fhl3的这个新的转录起始位点(TSS)。 没错,这个方法还能帮你 鉴定lncRNA转录起始位点 。 Figure 3. Excluding isoforms discovered by Cufflinks from the transcript abundance estimation impacts the abundance estimates of known isoforms, in some cases by orders of magnitude. Four-and-a-half-LIM domains 3 (Fhl3) inhibits myogenesis by binding MyoD and attenuating its transcriptional activity. (a) The C2C12 transcriptome contains a novel isoform that is dominant during proliferation. The new TSS for Fhl3 is supported by proximal TAF1 and RNA polymerase II ChIP-Seq peaks . Paper里用的是Mouse skeletal muscle C2C12 cells,小丫好奇人的同源基因是不是也有个新的isoform,刚好手里有所有已发表的人Fetal Liver的ChIP-seq数据,找出哪些转录因子结合在FHL3附近,画出了下面这个图: 位于屏幕中间那个基因就是FHL3,参考基因组上认为它的转录起始位点TSS位于第一个黑框里,然而我们看到第2和第3个黑框里也有PolII的结合信号,难道这里也有两个新的isoform?另外,GATA1、NFE2和TAL1在相同的位置也有很强的结合信号,这里一定有故事。 本文这些例文都是用《 找到了motif,怎样展示结果? 》介绍的工具找到的,文章有点老。明天找找新paper,再跟大家分享。
个人分类: 转录调控|3294 次阅读|1 个评论
Plan A详细步骤1234 | 哪个转录因子调控我的基因?
ChengyangWang 2018-2-8 11:03
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome 作者:小丫 来源: 嘉因 《 哪个蛋白质调控我感兴趣的基因?怎样筛选?基于分析或实验的可行方案V2.1 》一文讲了找上游转录因子的策略: Plan A:基于大量ChIP-seq公共数据挖掘 Plan B:motif分析预测 Plan C:ATAC-seq结合motif分析 motif系列 答疑帖一步步帮你实现了 Plan B 去哪找motif? 史上最全物种转录因子、motif数据库footprintDB 这段DNA上有我关心的motif吗? 点鼠标就能找启动子区的motif | meme-FIMO motif scan结果怎样看? 互补链上的motif有意义吗? motif结果怎样展示到文章里? 找到了motif,怎样展示结果? ChIP系列 带你实现 Plan A ,下个系列解决Plan C。 原理 在线 快速 查看结果 局限性 速查表 从哪里下载数据 怎样批量处理数据 怎样展示结果 本文讲1234,下一篇讲567。 1. 原理 原理很简单,下图一目了然。做一个ChIP-seq实验能找到一个转录因子调控的靶基因,成百上千个ChIP-seq放在一起,就能找到 任意一个基因被哪些转录因子调控 。 2. 在线 快速 查看结果的两种方法 方法一 用Cistrome data browser: a data portal for ChIP-Seq and chromatin accessibility data in human and mouse. Nucleic Acids Res 2016; Oct 26. 感谢Dr. Mei 在本文撰写中提供的帮助。推荐另一个非常好用的工具,出自同一作者: 去TCGA看表型,来CistromeCancer挖机制 | RNA-seq和ChIP-seq的完美结合 Cistrome Data Browser,http://cistrome.org/db,收集了GEO和ENCODE里人和小鼠的ChIP-seq和DNase/ATAC-seq数据,共38680套,每天还在跑新数据、上传。 如果您心中已经有了几个目标转录因子,想找ChIP-seq数据check一下;或者想挨个查看您关心的细胞类型里的转录因子,那就在线查看每个转录因子在你的基因附近的ChIP-seq信号。 具体查看方法: 例如搜索kidney,选择Homo sapions,列出人的各种factor的数据,点击Results条目查看详情。 点击右侧的WashU Browser或UCSC Browser就能查看结合信号 这是UCSC Browser的效果,黑色的瘦瘦高高的peak就代表这个转录因子在这个位置有结合信号。 如果 想同时查看多个转录因子 ,就在条目左边的小方块里打个勾。点击页面最下方的WashU Browser或UCSC Browser,前者更快。 WashU Browser的展示效果更美,左侧是sample信息,每行信号下面对应显示peak的位置,不用肉眼再去判断。 方法二 ENCODE,https://www.encodeproject.org,产生了大量高质量的ChIP-seq数据。 新来的小伙伴儿可能要先看下面的视频了解ENCODE ENCODE成员翁志萍介绍ENCODE ENCODE成员David Lamparter讲通过转录因子表达和染色质开放寻找染色质调控因子 ENCODE IDR pipeline QA 视频记录 Penn State 岳峰:ENCODE Roadmap workshop Penn State 岳峰:增强子与基因表达调控 Joel Rozowsky讲人、果蝇、线虫转录因子ChIP-seq数据整合分析ncRNA ENCODE成员Brenton R. Graveley讲 RBP database 4个物种ChIP-seq数量: 其中转录因子数量: 选择ChIP-seq、transcription factor,Homo sapiens,在右下角的results栏里,点击感兴趣的细胞系右侧的数字。 点击Visualize,选择hg38。 最多能添加100套数据到UCSC genome browser,查看某段DNA上的peak分布。鼠标移到感兴趣的track,出现sample信息。 3. 局限性 方法一的局限性: 用肉眼挨个看哪个track有peak,数据多了就要疯掉了。可以通过下篇介绍的456来解决。 只能看人和小鼠的数据;想看果蝇和线虫就用方法二;想看其他物种或ENCODE以外的果蝇、线虫数据,用下篇介绍的方法来解决。 Plan A本身的局限性:只能判断做过ChIP-seq的转录因子,如果关心的数据类型的ChIP-seq数据特别少,就很难遇到刚好调控你的基因的转录因子。如果没有阳性结果,就用本文开头提到的 Plan B或Plan C 解决。 方法二的局限性: 除了方法一的i和iii以外,最大的缺点就是不全,它只收录ENCODE相关项目的数据,其他ChIP-seq数据在这里看不到。它貌似是被拿来衬托方法一的。 4. 速查表: 您对哪种疾病感兴趣?哪个tissue?已经做了多少个ChIP-seq? 分别查看两个数据库里 人tissue转录因子ChIP-seq数量 ,做个预判。 Cistrome (下面的数字仅作参考,更新到2016年1月,比目前总数少1万多): 956 Blood 847 MammaryGland 744 None 738 Colon 473 Prostate 409 BoneMarrow 373 Embryo 317 Cervix 253 Lung 189 EmbryonicKidney 161 Liver 87 Brain 86 UmbilicalVein 58 Bone 56 Skin 45 Adipose 35 Foreskin 31 Endometrium 27 Cordblood 19 Kidney 19 FetalLiver 18 LymphNode 15 Breast 12 Cranial 11 Pancreas 10 ConnectiveTissue 8 Tonsil 8 SkeletalMuscle 8 EmbryonicLung 7 Muscle 6 Stomach 6 Heart 6 Coronaryarterysmoothmuscle 6 AdrenalGland 5 Esophagus 4 Ovary 4 ForearmSkinBiopsy 3 Headandneck 3 Bronchia 3 Artery 2 Uterus 2 UrinaryBladder 2 Thyroid 2 SpinalCord 2 PulmonaryArtery 2 PancreaticIslet 2 Gingiva 2 FetalSkin 2 FetalLung 2 Eye 2 Cerebellum 1 Testis 1 Spleen 1 Pancreaticductal 1 Epithelium ENCODE 792 blood 308 liver 236 kidney 236 lung 169 mammary gland 106 uterus 87 embryo 62 large intestine 60 brain 56 epithelium 41 intestine 39 skin of body 36 connective tissue 33 musculature of body 28 stomach 23 limb 22 prostate gland 22 vasculature 21 blood vessel 20 esophagus 20 lymph node 17 pancreas 14 adipose tissue 14 vein 12 breast 12 spleen 9 gonad 8 vagina 7 bone element 7 heart 7 lymphoid tissue 7 nerve 7 testis 6 adrenal gland 6 penis 5 ovary 5 thyroid gland 3 artery 3 bodily fluid 2 bone marrow 2 eye 1 bronchus 1 extraembryonic component 1 mouth 1 placenta 1 spinal cord 其他速查表: 做过ChIP-seq或ATAC-seq的物种 植物的ENCODE 植物ATAC-seq文章和数据 果蝇ATAC-seq数据和文章 水生生物的ATAC-seq数据和文章 miRBase物种名缩写 Ensembl基因组+注释 | 植物 Ensembl基因组+注释 | 动物
个人分类: 转录调控|7676 次阅读|0 个评论
non-coding区的SNP影响了转录?HaploReg视频
ChengyangWang 2018-1-5 12:37
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome 作者:小丫 来源: 嘉因 non-coding区域的SNP有什么生物学意义? 问题1 :全基因组测序或GWAS获得的很多变异位点位于non-coding区域,它跟表型的关系是怎样的? 或者,我想从转录调控机制入手,我关心的是SNP对基因转录调控的影响,该怎样分析呢? 问题2 :GWAS发现的变异位点本身可能并不能导致疾病,它附近可能存在一个high LD位点,那才是致病原因。 或者:我查的SNP没影响转录调控,这样就结束了吗?还可以继续努力,有可能它旁边的SNP才是Mr. Right,怎样找到这个Mr. Right呢? 上期回答了第1个问题: 变异会影响转录?SNP影响转录因子结合?RegulomeDB 本期介绍HaploReg,既能回答问题1,又能回答问题2。 上期送出的2016年ENCODE会议视频对RegulomeDB和HaploReg的介绍太简略,翻出2015年的ENCODE会议视频,小美女非常详细的讲了用RegulomeDB和HaploReg注释变异的操作步骤,最后还留了三道练习题。 由University of Massachusetts Medical School翁志萍Lab的Jill E. Moore讲解 扩展阅读: ENCODE介绍视频 | 由ENCODE成员翁志萍教授亲自讲解 前8分钟演示RegulomeDB,8分14秒开始演示HaploReg的用法 HaploReg地址: http://www.broadinstitute.org/mammals/haploreg/haploreg.php HaploReg既能回答问题1,也能回答问题2。 先来回答问题1,跟RegulomeDB对比着看。 例如rs2637839,在RegulomeDB里score为5,很少证据支持它影响转录因子结合。 只找到IK-2的motif和开放染色质信号,ChromHMM认为这里是转录静止状态。 再去HaploReg里查这个SNP rs2637839,对比两个工具的结果。 dbSNP ID标红色的是它自己,有promoter和enhancer的组蛋白修饰、开放染色质信号、Ik-2的motif、有eQTL,位于FXYD3的intron。 跟RegulomeDB比起来,有更多的证据支持rs2637839影响转录。尤其是HaploReg有eQTL证据,而RegulomeDB没找到eQTL证据。 对比两个工具的数据来源,发现HaploReg的eQTL除了收录GTEx analysis V6以外,还有EBI的GEUVADIS analysis和其他10个研究的结果。PWM来源也比RegulomeDB多。多了conserved regions,少了差异甲基化区域。 具体的注释异同看这两个页面:http://archive.broadinstitute.org/mammals/haploreg/documentation_v4.1.html http://www.regulomedb.org/help 扩展阅读: 把RNA跟基因型、疾病联系起来 | GTExPortal、dbGaP、recount2视频 组蛋白修饰预示着什么? 点击rs2637839查看详情。把dbSNP中的重要信息整理成了表格,RegulomeDB里的图和列表,在HaploReg里都整理成了汇总表。 上面回答了问题1。 下面回答问题2. 回到这个图,搜索rs2637839的同时找到好多high LD的SNP,认为它们跟rs2637839是连锁的。 为什么要找high LD的SNP位点呢? GWAS里看到跟表型高度相关的SNP位点不一定就是那个因,有可能high LD位点才是因。落实到这个例子,在Protein bound列,发现high LD位点rs4835,rs1672975,rs3833291有多个蛋白结合证据,推测可能是这些SNP影响AP2ALPHA、AP2GAMMA、INI1、ELF1、ZNF263等转录因子的结合,进而影响下游基因的转录。 默认r20.8,在Option里可以设置,注意第二行人种的选择: 扩展阅读: 连锁不平衡的计算 ——上海元莘生物 连锁不平衡文章常用图 ——源宜基因 最后还有三道练习题: 回复HaploReg,查看ppt和三道练习题的答案。
个人分类: 转录调控|6353 次阅读|0 个评论
变异会影响转录?SNP影响转录因子结合?RegulomeDB
ChengyangWang 2018-1-4 12:07
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome 作者:小丫 来源: 嘉因 看18分钟视频,彻底明白全基因组、外显子组、区域捕获测序 | 原理、优缺点、实验设计 12分钟视频,学会判断DNA测序质量好坏 5分钟视频,明白DNA变异位点是怎么找出来的 前面三期铺垫了DNA测序的三种方法的优缺点、高性价比的设计实验、质量问题的原因,以及各种找变异位点的工具的优缺点 ,讲的都是经验和comment 。如果想跟着案例一步一步模仿,请移步 生信技能树 。 终于可以切入我最想解决的问题了: “ 变异会影响基因转录调控吗? ” 问题的提出 问题1 :GWAS获得的很多变异位点位于non-coding区域,它跟表型的关系是怎样的? 或者,我想从转录调控机制入手,我关心的是SNP对基因转录调控的影响,该怎样分析呢? 问题2 :GWAS发现的变异位点本身可能并不能导致疾病,它附近可能存在一个high linkage disequilibrium(LD)位点,那才是致病原因。 或者:我查的SNP没影响转录调控,这样就结束了吗?还可以继续努力,有可能它旁边的SNP才是Mr. Right,怎样找到这个Mr. Right呢? 本期回答问题1,下期回答问题2。 方 法 Stanford University的Synder Lab的Collin Melton在2016年ENCODE会议上介绍了这个问题的研究策略:用ENCODE数据给变异做注释。 Variant Annotation using ENCODE Data: An Introduction to RegulomeDB and HaploReg 回复regulomeDB获得ppt。 推荐了两个变异注释工具: RegulomeDB , created by the Synder and Cherry Labs in 2012 http://www.regulomedb.org/ https://github.com/aboyle/RegulomeDB-Tools HaploReg ,出自Kellis lab。还记得Kellis吗? MIT理工男Manolis Kellis讲基因、疾病与治疗 | TEDx视频 http://www.broadinstitute.org/mammals/haploreg/haploreg.php 本期视频只介绍了RegulomeDB的用法,下期回答问题2时详细介绍HaploReg的用法。 告诉它你感兴趣的位点,它就告诉你这个位点的变异有没有影响转录因子结合,有没有影响基因表达。 原 理 从因果两个层面找证据,分析您的变异位点是否会影响基因转录。 转录调控是原因 :如果基因上游调控区发生变异就可能影响基因的转录激活。例如motif的变异导致TF无法结合,那么原本由该TF激活转录的靶基因无法正常转录,可能会导致肿瘤或遗传疾病发生。 基因表达水平是结果 :从eQTL数据能看到SNP造成的结果,即基因的变异导致附近基因转录水平的变化。 为了最全面的从因果两方面注释您的变异位点,RegulomeDB收集了各个层面的调控数据,编译自http://www.regulomedb.org/help: 转录因子的ChIP-seq,以ENCODE项目产生的为主、还包括一些非ENCODE项目产生的、以及ChIP-exo(最精准的ChIP-seq)数据; 组蛋白修饰的ChIP-seq,只用了Roadmap的数据,Roadmap Epigenomics Mapping Consortium(REMC); 开放染色质,用了ENCODE的DNase-seq; 用motif预测转录因子结合位点,包括TRANSFAC、Jaspar、UniPROBE和Jolma 2013年Cell paper里的PWMs; 差异甲基化区域,用Synder 2014年Nat Biotechnology paper里的; 1-5是因,6是果 eQTLs、dsQTL,包括如下组织:Cerebellum、Cortex、Fibroblasts、Frontal-Cortex、Liver、Lymphoblastoid、Monocytes、Pons、T-cells、Temporal-Cortex 怎样评价 根据上述证据设置score。TF结合是因,表达量变化是果。只有观察到SNP位点影响了基因转录水平的表达量变化,才给它更好的score,1开头。如果没有eQTL证据支持,就是以2开头。 举个例子 界面简单得不能再简单 识别多种输入格式:dbSNP ID、bed、VCF、GFF3或chr#:min_coord..max_coord。 例如,E2F1上下游区域,chr20:33,627,434-33,734,653,点击Submit。找到495个SNP,按照Score排序,rs1033799的score最高,点击1d 位点、结论和证据都反映在这张图上 后面是详细信息: K562细胞系的CEBPB、RCOR1、TAL1 ChIP-seq在这个位置有peak,说明CEBPB、RCOR1、TAL1结合在这个SNP附近; 出现了Zbtb12的motif,推测Zbtb12有可能结合; 有一个eQTL,在单核细胞Monocytes里影响了ITGB4BP的表达量; 在K562里看到DNase信号,说明这个位置是开放的,可能有调控蛋白结合; 组蛋白修饰说明在Blood T cell、B cell等细胞里是转录活跃的,而在ESC和iPSC里活跃程度低。 总结,SNP位点rs1033799很可能影响转录因子的结合,并影响靶基因的表达水平。
个人分类: 转录调控|8109 次阅读|0 个评论
转录调控期末考试,你能得多少分?
ChengyangWang 2018-1-4 10:56
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome 作者:小丫 来源: 嘉因 最近半年,嘉因公众号陆续推出转录和转录后调控系列研究策略。 听说小伙伴儿看到帖子就像捡到了金元宝,又是收藏,又是转发......然后,就木有然后了...... 收藏夹里的帖子,就像饺子,存进冰箱木有用,吃掉才是自己的。 今天小丫带你吃饺子。长按二维码,进入考试页面,看你能得多少分? 答案解析: 找靶基因: 转录因子调控了谁? 找上游调控因子: 哪个蛋白质调控我感兴趣的基因? 组蛋白修饰的ChIP-seq: 组蛋白修饰的ChIP-seq组蛋白修饰预示着什么? 转录因子的ChIP-seq: ChIP-seq和RNA-seq整合分析,BETA最擅长 ChIP-seq: ChIP-seq不画出这样的结果图,哪好意思说自己是做生信的 ATAC-seq: 老板让找DNA转录调控分子,这个技术十拿九稳 ENCODE: 由ENCODE成员翁志萍教授亲自讲解 Roadmap: Penn State 岳峰 GGR: 【答疑】ATAC-seq的重复次数 modENCODE、modERN: 人、果蝇、线虫转录因子ChIP-seq数据整合分析ncRNA
个人分类: 转录调控|1653 次阅读|0 个评论
我的转录组数据离文章发表还有多远?一个百迈客云的距离
candice880816 2016-6-28 11:24
2016 年转录组文章发表趋势 2016 年,功能基因的研究依旧是生物学研究永恒不变的热点。miRNA的热度没有消退,lncRNA的研究不断深入,circRNA最近很火,但是,miRNA、lncRNA、circRNA的研究都需要围绕mRNA展开。mRNA的研究不仅仅局限于标准分析,需利用更多的数据和工具深度解析生物学问题。 通过分析2016年不同影响因子的转录组文章框架,可以看出影响因子越高的文章,标准分析占的比例越少,而数据挖掘、公共数据及基因库的比例越多。然而,目前交给第三方技术服务公司所能提供的也只局限于标准分析部分。 但是,标准分析仅仅是数据深度挖掘的开始,离文章发表还有很远······ 百迈客云(BMKCloud)不仅可以提供标准化的分析,还可以提供数据深度的个性化分析和各种小工具,以及公共数据库和基因库功能,让您轻松实现高分文章发表。 深度挖掘——分析平台和工具 分析内容 应用场景 基于功能关键词的基因挖掘 通过功能关键词检索,对特定的基因集(基因家族)进行 GO 分类、 KEGG 通路分析 基于基因ID的基因挖掘 比较候选基因ID列表或已知功能的差异基因集合,用于文章讨论部分或课题拓展 样本间维恩图绘制 比较不同样本间共有及特异表达基因集合,通过GO分类、KEGG通路分析解析其特异或共有性状 差异表达参数调整 根据不同项目的需求,可调整FC和FDR等参数 基于仅上调或下调差异基因的数据挖掘 只针对上调或下调的基因进行GO分类、KEGG富集、GO富集、表达量聚类等分析 基于差异基因组合维恩图的数据挖掘 比较不同组合间共有及特异表达基因集合,通过GO分类、KEGG通路分析解析其特异或共有性状,解析不同组合间异同的作用机理。 转录因子分析 对筛选到的转录因子家族成员的表达模式进行聚类分析,根据不同表达类型推测参与不同生物学过程。 基于差异基因共表达趋势的数据挖掘 该分析使用于2个以上的时间序列样本,分析随时间推移基因表达变化模式,针对不同模式的基因集可做表达模式图及GO分类图、KEGG通路分析。 基于工具的数据挖掘(WGCNA) 基因共表达网络( WGCNA )中提取出不同的基因模块,解析基础代谢途径、转录调控途径、翻译水平调控途径等生物学过程。 更换参考基因组版本分析 基因组版本更新时,会大量更新基因数目及注释结果等,建议再次分析,并比较。 深度挖掘——公共数据 百迈客云平台数据库同步NCBI公共数据库,包含178,357个实验, 1,456,575个样本原始数据。 深度挖掘——基因库 百迈客云基因库收录了超过1,400万条基因信息,与分析平台紧密结合,为用户提供可靠的基因查询和分析服务。 百迈客云(https://www.biocloud.net)专业分析并提供高分文章研究思路及分析,一站式解决文章发表所有难题。 百迈客七周年之际,分享喜讯: 1 、与中国农业科学院王晓武研究员合作的芸薹属重测序项目文章在Nature Genetics发表。 2 、与浙江大学杨景华教授合作的异源四倍体芥菜基因组文章在Nature Genetics发表。
404 次阅读|0 个评论
志贺氏菌毒力基因调控机制—从染色体、质粒分配到转录调控
IPBCS 2015-8-25 08:45
志贺氏菌毒力基因调控机制 — 从染色体 、质粒分配到转录调控 在现代社会中,细菌性痢疾仍然是全球公共卫生安全面临的重大威胁之一。在发展中国家,细菌性痢疾的危害尤为严重。志贺氏菌属于革兰氏阴性杆菌,是导致细菌性痢疾的首要病原体。细菌性痢疾每年造成数十万人死亡,尤其对儿童的威胁最大 。 福氏志贺氏菌 是引起细菌性痢疾的主要病原体之一。在过去十几年中,我国流行的福氏志贺氏菌优势株为福氏 2a 301株。然而,最近我国科学家研究表明,新发现的福氏Xv志贺氏菌已经成为我国流行的优势菌株 。在以往的研究工作中,我们于2001年完成了福氏志贺氏菌2a301株的全基因组序列测定,是我国首个独立完成的微生物基因组项目,为志贺氏菌的致病机理研究提供了完整的遗传背景信息 。 志贺氏菌的基因组序列与大肠杆菌高度同源,其致病性主要基于细菌中约 230Kb的侵袭性大质粒。志贺氏菌的毒力基因集中分布在侵袭性大质粒中约31Kb的“entry region”中。这些毒力基因编码了三型分泌系统(T3SS)的效应蛋白、结构蛋白、调控蛋白及伴侣蛋白等大量蛋白质。志贺氏菌感染引发的细胞内病理变化和细菌性痢疾的临床表现正是由于T3SS大量的细菌毒力蛋白综合作用结果 。毒力基因的表达无疑为细菌造成巨大的代谢负担。因此,在进化的过程中,志贺氏菌形成了一个精巧的毒力基因转录和表达调控体系,由来自侵袭性大质粒的调控系统和来自细菌基因组编码的全局调控系统共同组成。志贺氏菌只有在特定的环境信号的刺激下(如中性的pH值和生理温度等),侵袭过程才能够启动 。 在不适宜的环境条件下,志贺氏菌的毒力基因的表达受到抑制。染色体编码的 H-NS蛋白通过结合毒力基因启动子附近的AT富集区形成转录抑制复合物,阻止RNA聚合酶向启动子下游移动,从而在转录水平抑制毒力基因表达。在适宜环境因素的诱导下,即温度、pH值和渗透压等环境参数与小肠内环境接近时,志贺氏菌毒力基因的转录开始被激活。毒力基因的激活通过一系列级联调控步骤实现,首先包括了 virF 基因的转录激活,其产物VirF蛋白继而激活 virB 基因的转录,造成VirB蛋白的表达上调,VirB蛋白能够特异性结合位于毒力基因启动子上游的DNA顺式作用位点( cis-acting site),从而解除H-NS介导的转录抑制作用 。最终导致位于侵袭性大质粒上的各种毒力基因转录的全面激活,引发志贺氏菌的侵袭。 VirB蛋白核心结构域(VirBcore)与毒力基因上游DNA顺式作用位点复合物晶体结构的解析为理解志贺氏菌转录调控机制迈出了坚实一步 (图1),晶体结构显示VirB蛋白核心结构域直接结合毒力基因顺式作用位点DNA双螺旋结构的“大沟”(majorgroove),决定了VirB蛋白识别序列的特异性。此研究结果填补了国际科学界对VirB蛋白识别DNA的猜测和印证。VirB蛋白核心结构域(VirBcore)与DNA的晶体结构及其结合DNA的生物化学和生物物理学的特性进一步揭示了VirB蛋白解除H-NS蛋白抑制毒力基因转录的初步分子模型,即VirB蛋白通过C-端结构域发生寡聚化,形成VirB的多聚体。VirB通过核心结构域准确定位到启动子上游的顺式结合位点,造成DNA双链在顺式作用位点处发生弯曲;DNA的弯曲进而引起下游DNA结合到VirB多聚体的其他DNA结合位点;最终造成DNA在VirB多聚体上的缠绕。VirB诱导的DNA构象变化可破坏H-NS-DNA转录抑制复合物的稳定性,释放RNA聚合酶复合物,激活毒力基因的转录 (图2)。 然而,细菌的转录调控是一个复杂的系统过程,目前对志贺氏菌毒力基因激活的分子机制的了解仅仅是冰山一角,现有的知识不足以解释 VirB蛋白如何实现基因的全局调控。比如,VirB蛋白可以在目的基因上游几千bp处实现基因的转录。这种现象是如何发生的呢?现有对VirB结构的信息和功能的研究不足以解释该现象。目前的猜测认为VirB通过桥接机制引发DNA的构型发生巨大转变从而解除H-NS的抑制。这种猜测主要基于以下理论研究,首先,VirB蛋白可以特异和非特异的结合DNA,从而在DNA上形成纤丝 ,这与其同源蛋白ParB蛋白类似,各种ParB分子集结在染色体DNA上从而形成高聚物有利于下一步的质粒分离。其次,序列分析比较发现,VirB蛋白N端结构域含有“RRLR”精氨酸簇,此簇高度保守。最近对质粒分离蛋白ParB家族spo0j研究表明 ,spo0j通过其多变的N端参与分子间的相互作用和高度保守的HTH结构域参与parS结合从而形成长形状的分子结构。 spo0j 通过其N端可以水平和垂直的与邻近分子作用从而形成高聚体。这种作用主要通过其高度保守的精氨酸簇。这种作用对其形成高聚物和ParB的播散至关重要。最后,体内单分子研究表明,spo0j可以使DNA形成环。对精氨酸簇突变(RRLR)研究表明其完全破坏了DNA桥。以上研究解释了为什么有限的spo0j(每个parS位点只有20个分子)分子可以跨越几千bp从而利于parB分子装载SMC复合物参与了染色体的分离 。 因此, DNA桥接是多种parB同源物的共同特性,志贺氏菌VirB蛋白可能具有相同的特性,这也暗示了其进化的保守型。鉴于以上的分析比较parB和VirB,我们可以认为和推测尽管VirB与parB功能不同,但是保持了parB祖先的特有功能即DNA的结合和DNA桥接。因此,对于VirB蛋白N端结构域的结构解析及与DNA复合物结构的解析,进而对VirB全长蛋白以及与DNA复合物结构的解析将终结这些猜测。最终通过体内外单分子研究将进一步阐释VirB蛋白如何在宏观层面调节DNA,在体内如何调节毒力大质粒的分子机制。此研究将深入揭示质粒分离蛋白如何进化为毒力转录的分子机制。 PDB:3VWB 图 .1.VirB蛋白核心结构域与目标启动子DNA的晶体结构 图 .2. VirB蛋白拮抗H-NS转录激活机制初步模型 发表SCI论文链接: http://nar.oxfordjournals.org/content/41/22/10529.long 参考文献 1 Bardhan, P., Faruque, A., Naheed, A. Sack, D. Decrease inshigellosis-related deaths without Shigella spp.-specific interventions, Asia. EmergingInfect. Dis. 16, 1718-1723 (2010). 2 Ye, C. et al. Emergence of a new multidrug-resistant serotype X variant in an epidemicclone of Shigella flexneri . Journal of Clinical Microbiology 48,419-426 (2010). 3 Zhang, N. et al. A genomic portrait of evolution and epidemic spread of arecently emerged multidrug resistant Shigellaflexneri clone in China. Journal ofClinical Microbiology , doi:10.1128/jcm.02669-13 (2014). 4 Jin, Q. et al. Genome sequence of Shigellaflexneri 2a: Insights into pathogenicity through comparison with genomes of Escherichia coli K12 and O157. Nucleic Acids Research 30, 4432-4441(2002). 5 姜铮,王芳,何湘,黄留玉,袁静.志贺氏菌致病机制研究进展. 中国热带医学9, 1372-1383 ( 2009). 6 朱立, 王恒樑. 志贺氏菌三型分泌系统及其致病机理. 微生物学报 50, 1446-1451 (2010). 7 Kane, K. A. Dorman, C. J.VirB-mediated positive feedback control of the virulence gene regulatorycascade of Shigella flexneri . Journal of Bacteriology 194, 5264-5273(2012). 8 Gao, X. et al. Structural insights into VirB-DNA complexes reveal mechanism oftranscriptional activation of virulence genes. Nucleic Acids Research 41, 10529-10541 (2013). 9. Chen BW, Lin MH, Chu CH, HsuCE, Sun YJ Insights into ParB spreading from the complex structure ofSpo0J and parS. Proceedings of theNational Academy of Sciences of the United States of America 112(21):6613-6618 (2015) . 10. Graham TGW ,et al. ParB spreading requires DNA bridging. Genes Development 28(11):1228-1238 (2014) .
个人分类: 细菌毒力研究|6520 次阅读|0 个评论
[转载]zz转录五十年III: 真核时代 I: 转录因子
热度 1 zls111 2011-3-12 12:42
发信人: dahaoren (大好人||机枪射手!), 信区: Life_Science 标题: zz转录五十年III:真核时代I:转录因子 发信站: 日月光华 (2011年03月11日23:10:58 星期五), 站内信件 ☆──────────────────────────────────────☆ wxbioman(0170·白二门·一改签名档一学期就过完了) 于 2010年04月15日08:22:00星期四 提到: 发信人:acroding(闲云野鹤),信区:Biology 标题:转录五十年III:真核时代I:转录因子 发信站:BBS未名空间站(SatFeb623:42:082010,美东) 故事终于进入真核时代了,下面将提到的众多人物很多是现在活跃在第一线的非常hot 的PI,板上恐怕也少不了有人在这些人的实验室,所以如果我写的东 西有什么地方不太准确的还请大家多多包涵。 Roeder在69年的Naturepaper中报道,从海胆中分离到了三种对盐浓度敏感程度不同的 RNA聚合酶,而在大鼠肝脏中有两种这样的活性。这是人们第一次明确的在真核生物中 找到RNA聚合酶。有趣的是这样一篇Nobel级别的文章一开始被Nature给直接咔嚓了。这 是Roeder在一篇访谈中提到的,他当时觉得再找个地方赶快发了,不过最后他的院士老 板WilliamRutter一个电话搞定了Nature的editor,最终我们在Nature上看到了这篇历 史性的文献。(呵呵,这个怎么说呢,有个大老板就是不一样啊,关键的时候起到的是 一锤定音的作用,所以大家可以的话还是尽量找大腿抱吧。)一年之后,Pierre Chambon(NuclearReceptor的那位大拿)拿α鹅膏覃碱对真核的RNA聚合酶搞了搞,然 后么,大家就在每本生化教科书上看到了依照对α鹅膏覃碱的抗性而分成的RNA聚合酶I ,II,III。由于当时原核转录依然很hot而且研究真核的实验条件尚不成熟,Roeder的发 现并没有将大家的注意完全转移到真核上。RobertRoeder在Carnegie研究所经过短暂 的postdoc之后,便在WUSTL开始了自己的PI生涯,继续从事RNA聚合酶一二三的生化研 究。真核转录的下一个高潮将在Roeder的Naturepaper9年之后到来,历史也在等待着 新一代的biochemist大拿们的出现。 时钟的指针指向了1978年,这时候不满三十岁的RobertTjian从病毒中分离纯化到了第 一个 非细菌转录激活因子SV-40Tantigen。这里有必要介绍一下Tjian,作为本文中出现的 第一 个华裔。Tjian中文名钱 泽南,(据说和加州另外两钱,RogerandRichardTsien几百年前是一家,我没有考证 过, 不知 哪位8g一下),不过不同于另外两钱的是他不出生在美国,而是在香港,应该是49年解 放的时候他家跑过去的,后来又辗转到了南美,具体点巴西,最后到了新大陆安家。 Tjian的PhD师从枯草杆菌大牛Harvard的RichardLosick,主要在枯草里做转录,做一 些RNA聚合酶sigma因子相关的东东,用现在板上的话叫ridingthetrend,把大肠那一 套拿到枯草里。不过,这段时期Tjian练好了蛋白纯化的基本功。76年毕业以后,Tjian 去冷泉港干了三年post,正是在这期间发现了SV-40Tantigen这个可以和特异性结合 DNA激活转录的non-bacterialtranscriptionfactor。两年以后,1980年Roeder也是 爪蟾的卵母细胞中纯化到了TFIIIA这个RNA聚合酶III专一性的转录因子,这是第一个真 核转录因子。可惜的是,TFIIIA并不负责protein-coding的基因的转录。因此,这个 因子的重要性多少打了点折扣。又过了三年,上帝似乎对比Roeder年轻的Tjian更加有感 情 ,1983年 ,已经在Berkeley建立自己实验室的他终于找到了人类的第一个特异性的转录因子SP1 。这个里程碑式的发现也是华人在分子生物学时代为数不多的Nobel级别的原创性贡献 ,其影响套用一句老话就是“怎么评价都不过分”。真核中转录因子的发现为今后各种 各样的signalingpathway奠定了基础,因为所有的外界信号不管中途如何传递,最终 都要由特异性的转录因子来完成对基因表达的调控从而使生物体体现出相应的表型。80 年代是现代分子生物学风起云涌的10年.这十年间由于分子克隆技术的成熟,n多的明星 分子被发现,这里面包括ArnoldLevine和DavidLane的p53,Wen-HwaLee的Rb,David Bal timore的 NF-kappaB,PhilipLeder的Myc,PierreChambon和RonEvans的nuclearhormone receptorsuperfamily等等,最后这些大腕全部被证明是转录因子从而revolutionize 了生物学各个领域,cancer,developmentalbiology,immunobiology, endocrinology,virology,younameit。现在做生物的有几个敢说自己完全不做 transcriptionfactor的,这也是为什么Tjian的江湖地位为啥这么高,可以在去年接替 ThomasCech统领HHMI的science上的原因所在。另外值得一提的是,Tjian不光science 做得好他在biotechindustry也是一根标杆。他与DavidGoeddel(Genentech的第一个 scientist生物制药界的传奇人物,shuhongbin的post老板),SteveMcknight(院士, 现在在西南转录界的另一为大腕成名于TKgenepromoter及leucine-zipperdomain protein)一起创立了Tularik。他们从一间房起家到最后13亿被Amgen并购,这在当时 的biotech界绝对是一个传奇。我友善的猜测一下,Tjian现在应该至少是一个数千万的 富翁吧,那么HHMI的百万年薪看上去也就不那么多了。 Anyway,真核转录从此迎来了自己的“黄金十年”。 做得好他在biotechindustry也是一根标杆。他与DavidGoeddel(Genentech的第一个 scientist生物制药界的传奇人物,shuhongbin的post老板),SteveMcknight(院士, 现在在西南转录界的另一为大腕成名于TKgenepromoter及leucine-zipperdomain protein)一起创立了Tularik。他们从一间房起家到最后13亿被Amgen并购,这在当时 的biotech界绝对是一个传奇。我友善的猜测一下,Tjian现在应该至少是一个数千万的 富翁吧,那么HHMI的百万年薪看上去也就不那么多了。 Anyway,真核转录从此迎来了自己的“黄金十年”。 ☆──────────────────────────────────────☆ qrupdhlcn(比目鱼) 于 2010年04月15日12:01:20星期四 提到: 去年开一个epigenetics的小会,一张长条形的桌子,一头是投影仪屏幕,一头坐着一个 穿着很有风度的老头,感觉那气场很威严,肯定是个大拿。就问那是不是传说中的epige netics老大DaveAllis,旁边人告诉我,旁边那个慈眉善目的瘦老头才是Dave,那问是 谁,结果被鄙视,说江湖地位比Dave高,又相关还有谁,当然是BobRoeder了。 这才知道江湖还有这么一号人物。他做的东西肯定够nobel级别了,但是这老头脾气不大 好,和圈子里的人吵了几十年的架,估计好多应该评给他的就因为这个黄了。 :发信人:acroding(闲云野鹤),信区:Biology :标题:转录五十年III:真核时代I:转录因子 :发信站:BBS未名空间站(SatFeb623:42:082010,美东) :故事终于进入真核时代了,下面将提到的众多人物很多是现在活跃在第一线的非常hot :的PI,板上恐怕也少不了有人在这些人的实验室,所以如果我写的东 :西有什么地方不太准确的还请大家多多包涵。 :Roeder在69年的Naturepaper中报道,从海胆中分离到了三种对盐浓度敏感程度不同的 :RNA聚合酶,而在大鼠肝脏中有两种这样的活性。这是人们第一次明确的在真核生物中 :找到RNA聚合酶。有趣的是这样一篇Nobel级别的文章一开始被Nature给直接咔嚓了。这 :.................(以下省略) ☆──────────────────────────────────────☆ qzzzz(唯恐醉酒鞭名马,奈何情多误美人) 于 2010年04月15日12:23:53星期四 提到: 诶,在国内消息太闭塞了。。。 roeder这几年是不是不不大活跃了。。? :去年开一个epigenetics的小会,一张长条形的桌子,一头是投影仪屏幕,一头坐着一个 :穿着很有风度的老头,感觉那气场很威严,肯定是个大拿。就问那是不是传说中的epige :netics老大DaveAllis,旁边人告诉我,旁边那个慈眉善目的瘦老头才是Dave,那问是 :谁,结果被鄙视,说江湖地位比Dave高,又相关还有谁,当然是BobRoeder了。 :这才知道江湖还有这么一号人物。他做的东西肯定够nobel级别了,但是这老头脾气不大 :好,和圈子里的人吵了几十年的架,估计好多应该评给他的就因为这个黄了。 ::发信人:acroding(闲云野鹤),信区:Biology ::标题:转录五十年III:真核时代I:转录因子 :.................(以下省略) ☆──────────────────────────────────────☆ qrupdhlcn(比目鱼) 于 2010年04月15日12:29:08星期四 提到: 没有当年那么活跃了 以前全盛时候他在rockefeller的实验室有50+的postdoc 现在只有将近20来号人了吧 :诶,在国内消息太闭塞了。。。 :roeder这几年是不是不不大活跃了。。? ::去年开一个epigenetics的小会,一张长条形的桌子,一头是投影仪屏幕,一头坐着一个 ::穿着很有风度的老头,感觉那气场很威严,肯定是个大拿。就问那是不是传说中的epige ::netics老大DaveAllis,旁边人告诉我,旁边那个慈眉善目的瘦老头才是Dave,那问是 ::谁,结果被鄙视,说江湖地位比Dave高,又相关还有谁,当然是BobRoeder了。 ::这才知道江湖还有这么一号人物。他做的东西肯定够nobel级别了,但是这老头脾气不大 ::好,和圈子里的人吵了几十年的架,估计好多应该评给他的就因为这个黄了。 :.................(以下省略) ☆──────────────────────────────────────☆ wxbioman(0170·白二门·一改签名档一学期就过完了) 于 2010年04月15日12:44:02星期四 提到: 这哥么tough的出名 当年手下postdoc互投同位素。。。。。。 :去年开一个epigenetics的小会,一张长条形的桌子,一头是投影仪屏幕,一头坐着一个 :穿着很有风度的老头,感觉那气场很威严,肯定是个大拿。就问那是不是传说中的epige :netics老大DaveAllis,旁边人告诉我,旁边那个慈眉善目的瘦老头才是Dave,那问是 :谁,结果被鄙视,说江湖地位比Dave高,又相关还有谁,当然是BobRoeder了。 :这才知道江湖还有这么一号人物。他做的东西肯定够nobel级别了,但是这老头脾气不大 :好,和圈子里的人吵了几十年的架,估计好多应该评给他的就因为这个黄了。 ::发信人:acroding(闲云野鹤),信区:Biology ::标题:转录五十年III:真核时代I:转录因子 :.................(以下省略) ☆──────────────────────────────────────☆ qzzzz(唯恐醉酒鞭名马,奈何情多误美人) 于 2010年04月15日12:48:39星期四 提到: 50+postdoc。。。 想起我老板谈rosenfild,一个课题3个post同时做,一年以后有希望的那个留下 ,另两个开掉。。。。 :没有当年那么活跃了 :以前全盛时候他在rockefeller的实验室有50+的postdoc :现在只有将近20来号人了吧 ::诶,在国内消息太闭塞了。。。 ::roeder这几年是不是不不大活跃了。。? ::.................(以下省略) ☆──────────────────────────────────────☆ zxt(AsokaAkbar) 于 2010年04月15日14:25:56星期四 提到: 不过看起来Danny和Allis人还都不错 :这哥么tough的出名 :当年手下postdoc互投同位素。。。。。。 ::去年开一个epigenetics的小会,一张长条形的桌子,一头是投影仪屏幕,一头坐着一个 ::穿着很有风度的老头,感觉那气场很威严,肯定是个大拿。就问那是不是传说中的epige ::netics老大DaveAllis,旁边人告诉我,旁边那个慈眉善目的瘦老头才是Dave,那问是 :.................(以下省略)
个人分类: 转载和评述|3557 次阅读|1 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-6 17:31

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部