恒常月的个人博客分享 http://blog.sciencenet.cn/u/恒常月

博文

综述完整版:基于第二代测序技术的植物遗传和表观遗传学研究

已有 8579 次阅读 2012-4-27 12:32 |系统分类:论文交流|关键词:学者| 表观遗传, 遗传, 高通量, 第二代测序技术

基于第二代测序技术的植物遗传和表观遗传学研究

摘要

继链终止法和化学测序法等第一代测序技术后,实现了高通量平行测序的第二代测序技术于2004年开始商业化。因为读长短的特性,它很适合应用于对生物体内天然存在的小RNA进行深度测序;随着读长的逐渐增加和将短序列比对回基因组算法的日益成熟,现在它广泛地应用于涉及全基因组水平分析的生物学研究。比如在植物遗传学研究中,通过对不同群体或自然突变体的全基因组重测序,它可以作为一种对各种表型特别是数量性状(QTL)进行正向定位和全基因关联分析的新技术手段,加速对表型关联基因所在区段的鉴定。在表观遗传学研究中,通过抗体将组蛋白结合的DNA富集后进行测序,或者用重亚硫酸盐(Bisulfite)试剂处理后进行测序,这样在不同发育阶段或生长环境下,不同修饰的组蛋白在染色体上的变化和全基因组水平的DNA甲基化等表观修饰得以被动态地观察;对各种RNA的测序发现了越来越多的起着转录或转录后调控的miRNA和功能siRNA,对转录组的测序还揭示一个基因位点普遍存在不同的剪接体且基因组很多非编码区也存在潜在的转录活性。另外作为研究蛋白与DNA相互作用的一种方法,通过ChiP-seq,各种关键的转录因子结合的特定顺式元件也被陆续鉴定。二代测序产生了海量的数据,相应的算法和软件也在不断更新优化。

 

关键词:第二代测序技术 高通量 遗传 表观遗传 

 

Abstract

After the first generation sequencing technology of chain termination method and chemical sequencing method, the second generation sequencing technology which could be massively parallel sequencing became commercially available in 2004. Because its character of short reads, it is suitable to perform the small RNA deep sequencing which are natural exist in biological organism. With the increase of reads length and the algorithm of short reads aligning to the genome sequence, nowadays it widely apply to the biological research which refer to analysis in genome-wide level. For example, in the plant genetics research, as a new method for mapping or genome-wide associated study with the phenotype especially quantitative trait, it accelerates the detection of phenotype-associated physical location, through the genome re-sequencing of different group or nature mutants. In the plant epigenetic research, DNA combined by different mortified histones are collected by specific antibody, or the DNA treated with Bisulfite are recycled; after sequencing, the changes of mortified histone in chromosome and whole-genome DNA methylation in different development period or environments could be observed. RNA sequencing uncovers more and more miRNA and functional siRNA playing the role in transcriptional or post-transcriptional regulation; the transcritome suggests most gene loci could produce different splicing transcripts, and multiple non-coding regions have the potential transcript activity. Finally, as a tool for detecting the interaction between DNA and protein, many cis-elements as the motif of important transcription factor are identified through ChiP-sequencing. Massive data are generated by the second generation sequencing technology, and the related algorithm and software are also updated and optimized. 

 

Key words: second generation sequencing technology, high-throughput, genetics, epigenetics

 

1 背景——第二代测序的历史与技术流程

第一代测序技术始于1975年桑格的双脱氧链终止法测序法[12]1977年吉尔伯特等的化学测序法[3],发展到现在,Sanger测序用四种不同的荧光染料分别标记片段末端不同的碱基,通过电泳将不同长度的片段分开,根据末端碱基得到原始序列信息。目前,桑格测序可以测到8001000个碱基,但是测序通量很小,而且价格昂贵。20042005年间开始商业化使用的第二代测序技术(下一代测序技术)克服了以上两个缺点,它可以同时对多个DNA片段进行平行测序:核心就是将打碎后建库的DNA片段锚定在固体介质表面,比如通过连接接头的方法将DNA片段锚定在多个磁珠上进行PCR反应(Roche/454平台),或者锚定在测序通道内表面进行桥式PCRIllumina平台)。通过对每个锚定DNA每加一个碱基进行一次“加上荧光染料——洗脱多余染料——荧光成像扫描”的循环过程,实现平行高通量的深度测序[4]。目前常用的平台是Roche/454公司的FLX测序仪和IlluminaHiSeq2000测序仪,另外还有SOLiD的测序平台。根据提供的DNA来源和前期处理的不同,二代测序技术可以用以解答不同研究目的的生物学问题。本文主要阐述该技术在植物遗传和表观遗传学研究中起到的一些推动作用。

 

2 基于第二代测序技术的植物遗传学进展

2.1 利用高通量SNP作为分子标记进行的基因初定位

   植物正向遗传学通过分子标记(marker)来对存在多态性的父母本后代群体的表型进行基因组区段的关联分析。传统的方法是通过设计引物进行PCR扩增,跑电泳后根据不同的带型(主要是长度大小的多态性)跟表型的关联度来进行遗传连锁图谱的构建。这个工作量大且周期较长。在双亲SNP信息齐全的情况下,采用第二代测序技术对子代群体进行低覆盖率的测序,人们可以通过连续的单碱基多态性(SNP)作为分子标记来构建遗传图谱。

SNP作为分子标记实质上是跟踪双亲染色体在后代的重组事件,因为子代发生的重组事件相对是有限的,所以通0.1×甚至更低覆盖率的测序即可得到饱和的SNP标记。比如在韩斌组研究的群体——水稻F11代重组自交系的150个株系中,通过0.02×覆盖率的重测序检测到的重组位点将基因组分割成2334个区段(bins),这些区段即可作像传统的分子标记一样与统计的表型进行遗传连锁图谱的构建[5,6]。此外,即便在双亲SNP不全的情况下,还可以在子代0.05×覆盖率的测序基础上,通过最简约的重组原则和隐马尔可夫模型(HMM)推导出双亲的SNP信息,从而实现遗传图谱的构建[7]。考虑到群体太大时测序价格的昂贵和对表型统计工作量的增大,一般进行初定位的群体是有限的,这样重组事件平均只能将染色体区段切割在100kb左右的数量级上,所以通过重测序只能代替传统的初定位方法,还无法代替精细定位。但是通过对关联区段的基因功能分析,还是可以候选到关联基因进行表型验证。

 

2.2 利用自然突变体进行的全基因组关联分析

在人类疾病研究中,通过对多个病人和正常人群体进行SNP芯片杂交,进行全基因关联分析(GWAS),利用连锁不平衡的规律,可以找到与疾病高度关联的染色体区段[8,9]。这种方法在人类中已经非常普及,植物在这方面的研究报导较少,在植物中目前许多作物还没有完善的SNP信息,目前主要是在水稻且通过重测序的方法进行全基因关联分析。韩斌实验室收集了全世界517个水稻自然突变体,进行平均1倍覆盖率的测序,通过GWAS的方法鉴定了14个水稻农艺学性状[10];另外又通过960个水稻自然突变体进行了与开花时间和谷粒产量相关的全基因组关联分析[11]Detlef Weigel等在拟南芥中开展了1001个基因组计划[1213],对世界各地的各种拟南芥自然突变体进行了重测序,提出利用自然突变体进行的全基因组关联分析将成为研究植物的下一代遗传学手段[14]

 

3 基于第二代测序技术的植物表观遗传学进展

3.1 mRNA进行转录后调控的植物miRNA

   植物miRNA2001年在拟南芥中被首次发现,2005年小RNA深度测序方法开始广泛使用,依据miRNA前体的茎环结构特点[15],一大批植物保守和物种特异的miRNA被发现。在物种特异的年轻miRNA中,根据序列同源性,很多miRNA前体被观察到保留着进化的痕迹。比如我们在白菜鉴定的19个新miRNA中,有10个可能是从它调控的靶基因中倍增而来,另外有1个可能来自于转座子[16]。戚益军实验室通过抗体将不同AGO蛋白结合的siRNA富集后,发现AGO1比较特异地结合以碱基U开头的miRNA[17]miRNA在植物体内主要发挥着剪切靶基因的转录后调控,通过降解组的测序验证了一些miRNA对预测互补靶基因的调控[18]。随着深度的加深,我们也发现在许多miRNA前体中会产生其他的小RNA或者不同大小偏移程度的miRNA变体,它们普遍的生物学意义还知之不多。

 

3.2 来自不同合成途径、功能多样化的siRNA

   在植物小RNA深度测序的产物中,24nt的小RNA丰度是最高的。它们主要是由植物特有的PolIVPolV聚合酶转录而来,在体内与AGO4结合发挥着介导DNA甲基化的作用[19]。拟南芥中还存在着一类由miRNA介导产生的ta-siRNA,其中TAS1TAS2miR173驱使产生,TAS3miR390驱使产生[20]。我们发现miR173, TAS1TAS2在同为十字花科的白菜中并不存在[16],说明它们比较特异地存在于芥属中,相反miR390TAS3在水稻等单子叶植物中都普遍地存在。另外还存在着一类由天然反向转录本产生的nat-siRNA,朱健康实验室发现了第一个从反向转录本中产生的内源小RNA,该小RNA在盐胁迫中诱导上调,通过降解其中一个转录本而起到耐盐的作用[21]。随后在拟南芥和水稻中发现有许多潜在的天然反向转录本,在测序中也发现了在其互补区域产生的小RNA,但其是否能对相应的转录本进行调控目前所知甚少。

 

3.3 全基因组水平甲基化的分析

   DNA中的胞嘧啶会被甲基化修饰,主要有mCGmCHGHC,A,T)和mCHH三种类型。植物中DNA甲基化需要甲基转移酶DRM1/2从头甲基化,和CMT3/ MET1进行维持,ROS1等又对其进行去甲基化[22],从而使基因组在不同的发育阶段和环境条件下呈现出动态的甲基化修饰。Lister等通过对拟南芥的花序分生组织及相应突变体同时进行了Bisulfite测序、小RNA测序和方向特异的RNA测序[23],他们发现全基因组部分范围的DNA甲基化现象与该区域小RNA的表达高度关联,即普遍存在依赖于RNA途径的DNA甲基化(RdDM)。日本实验室的Seiji Takayama发现白菜自交不亲和株系的显隐性关系是由于以下原因导致:显性的SP11基因旁邻产生了一个长链非编码RNA,进一步加工成的24nt-siRNA介导了隐性SP11启动子的甲基化,使其转录沉默[24,25]。植物由来已久的副突变(paramutation)现象近来也发现与转录出来的非编码重复串联序列和RNA介导的转录沉默有关[26]。其中异染色质区高度甲基化,转座子区域的甲基化水平被认为能够调控转座子的活性[27]。另外还有一部分DNA甲基化是不依赖于RNA的,其中一种位于基因内部,朱健康推测这种甲基化可能能够抑制转座子插入到基因内部或者防止重组在基因内部发生[28]。最近来自法国和以色列的实验室同时发现低甲基化(甲基化突变体)能够促进常染色质区的重组频率,但却抑制或不影响原本高甲基化的臂间异染色质区的重组频率[29,30],其中的机理尚不明确。目前研究者开始在植物不同野生型群体中开展DNA甲基化的研究,以期了解环境对于植物表观遗传变异的影响和逆境诱导的获得性表观变异[31]

 

3.4 不同修饰的组蛋白在染色体的动态变化

   DNA甲基化往往与组蛋白重塑高度关联,不同发育阶段和环境下不同类型的组蛋白修饰对染色体起着动态的表观遗传调控。组蛋白的甲基化修饰发生在H3K4H3K9H3K27(有me1,me2me3三种),通过特异的抗体进行的ChiP-seq,可以鉴定特定时期这些不同修饰的组蛋白所结合的DNA序列,通过PolII结合的位置,分析它们对相应区域转录活性的影响。人们根据这些表观遗传的高通量测序结果绘制出了果蝇的基因组百科全书[32]。在拟南芥中Roudier通过对8种不同修饰组蛋白的观察,认为主要存在着四种组合类型的染色质状态[33]。另外Jacobsen总结在异染色质区和转座子区组蛋白修饰主要以H3K9me2的形式存在,受抑制的基因组蛋白修饰主要以H3K27me3存在,而激活的基因区域组蛋白修饰以H3K4me3H3K4me2H3K4me1三种形式存在且伴随着mCG甲基化[34]。在动物中有一个保守的锌指蛋白CTCF,它扮演着转录激活子/抑制子、绝缘子、使X染色体失活等多种角色,近来的chip-seq发现它将染色体相隔一定距离的DNA序列粘连在了一起,得知它结合并调控着染色体内部的四维结构建成和不同染色体之间的物理接触,由此可以观察染色体高维的动态变化[35]。目前这方面的研究在植物中还没找到相似功能的蛋白。

 

3.5转录组测序提供的一些表观遗传学信息

  目前通过转录组测序发现一个基因位点大多会转录加工成不同的拼接体;随着各种材料测序深度的加深,许多新转录本被特异地在一些特定时期和特定部位中被检测到。在动物中发现了许多长链非编码RNA (lncRNA)[36],植物中春化过程中的重要因子FLC所产生的反向转录本得到了深入地研究[37,38],但是通过高通量测序得到的功能lnc-RNA还知之甚少。另外通过对杂交一代的转录组测序可以检测特定组织中转录本来自母性染色体和父性染色体的差异。在动物胚胎中母性效应占主导已是共识,在植物胚胎中目前还尚存争议[39,40]Nodine通过杂交一代中的SNP作为标识来区分转录本来自父本还是母本,发现来自父亲的转录本表达量整体差异并不显著[40]。另外在RNA测序过程中,发现许多RNADNA不一致(RDD)的碱基,有实验室认为生物体内可能存在着高频率的RNA编辑(在B细胞外显区发现一万个以上的位点)[41],但是更多的研究者评论这更多可能是技术缺陷引起的错误。我们在自己的RNA测序中也发现了相当高频率的RDD位点,经过统计分析,RDD碱基转换与颠换的比例与品种间基因组SNP的碱基转换与颠换的比例非常接近,暗示这种差异不像是由特异的RNA编辑引起,有待进一步实验验证,但目前还不明了这种RDD是否会由建库过程中RNA反转录成cDNA的过程引入。

 

4 讨论与展望

4.1 第二代高通量测序技术的数据挖掘:生物信息分析工具的提升

   第二代测序技术产生了海量的短片段数据,如何将其高效且准确地比对回参考序列是生物信息学者面对的首要挑战。BLAST通过动态规划算法将长片段的序列比对回参考序列,但这不并适用于的短序列。2009年华大基因(BGI)开发的SOAPaligner软件采用了种子序列和对背景基因组建立哈希索引表的方法来提高比对效率,且对一个碱基进行2个比特的编码以减少存储空间[42]。升级后的SOAP2以及BWAbowtie等比对软件都用到了基于字符串比对的BWT (Burrows–Wheeler Transform)算法[43, 44, 45],通过后缀数组排序建立索引和后向搜索策略有效地降低了时间复杂度和存储空间而不影响准确度。目前升级后的bowtie2在完整文本索引的基础上引入了局部动态规划,这样使允许gap的比对效率也得到了提高[46]。多数比对产生SAM格式的文件(SOAP除外),samtools工具可以对其进行各种后续处理[47],其中包括排序、索引后导入到基因组浏览器软件(IGV)中进行图形化查看[48]

比对回基因组后根据不同的分析目的,许多开源的生物学软件也大量地涌向。其中鉴定SNP是一个重要的步骤,许多后续的分析是基于SNP信息的,比如重测序群体的初定位,自然突变体的全基因组关联分析等,其中SOAPsnp软件基于SOAP2的比对结果进行染色体排序后可用于鉴定SNP[49],新近开发的sniper软件是设计用于在bowtie的比对基础上鉴定SNP的,但它也适用于一切SAM格式的文件[50]。这两个软件都是基于贝叶斯概率模型来进行SNP鉴定。对于RNAseq的结果,在背景基因组注释完善的物种,鉴定剪切体和分析表达量差异是一个主要的目的,这方面目前常用的软件有Tophatcufflinks[51];通过重头拼接得到新转录本的软件还有velvet/OasesTrinitytrans-ABySS[52]等。此外根据重测序结果鉴定插入和删除(INDEL),倒位重排等染色体变异(SV)也是一个重要的挑战,目前在使用的一些软件有BreakDancer, PINDELSOAPsv[53],但华大基因并没有公布SOAPsv的所有源代码,PINDEL只能鉴定短的插入序列(100bp以内),这些软件在鉴定长片段插入序列和其他复杂SV时都有相当比例的假阴性,这个也跟重测序的深度有关。ChiP-seq的目的是鉴定到特异的结合位点,目前的CisGenome浏览器能够可视化地进行峰值差异分析和Motif鉴定[54];针对Bisulfite测序结果开发的软件目前有BiQ-AnalyzerQUMA BISMA[55]。随着数据量的累积和产生大量冗余信息,解决数据存储和共享问题也是一个当务之急。目前云计算成为一种趋势,人类1000个基因组计划已陆续提交到亚马逊的云计算中,将更方便研究者对其数据的分析。

 

4.2 第三代单分子测序技术

第二代测序的应用正如火如荼,用于数据挖掘的相应算法和软件也日益完善,但是它也存在着一些缺陷:RNA需要先反转录成cDNA,测序通过合成的方式进行,这样就有可能由系统引入错误碱基,且经PCR扩增放大。为克服这些不足,第三代单分子测序技术正在酝酿之中,其中牛津的Nanopore技术尝试让单分子DNA在离子浓度梯度的驱动下通过Nanopore时被切割,IBMDNA晶体管技术尝试让单分子DNA通过狭窄的孔道时检测到发出的不同电信号来区分不同碱基[56],目前这几个研发公司已经进入提高准确率的技术攻艰阶段,在不远将来有望得到应用。

 

4.3 全基因组水平的生物学问题

   随着高通量测序变得相对廉价,以自然突变体为材料的第二代遗传学开始兴起,群体进化分析成为可能,单细胞水平的基因组测序将成为一种趋势,甚至每条染色体分开进行的倍性分析也已有报导。DNA进行复制、转录、重组和修复这些基本事件与表观修饰的动态关系可以在全基因组的尺度得到重新的审视,染色体高维结构有可能通过DNA间的粘连所重构,RNA加工的各种中间形态可以被捕捉到,通过亚细胞器或者与特异蛋白的结合可以分离到其特定时期所在的场所和发挥的功能。这些还有赖于物理仪器、生化技术的同步提升和数据挖掘的算法改进。

 

参考文献

1. Sanger, F. and Coulson, A.R. (1975) A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase. J. Mol. Biol., 94, 441–448.

2. Sanger, F., Nicklen, S. and Coulson, A.R. (1977) DNA sequencing with chain-terminating inhibitors. Proc. Natl Acad. Sci. USA, 74, 5463–5467.

3. Maxam, A.M. and Gilbert, W. (1977) A new method for sequencing DNA. Proc. Natl Acad. Sci. USA, 74, 560–564.

4. Metzker, M.L. (2010) Sequencing technologies—the next generation. Nat.Rev. Genet., 11, 31–46.

5. Xuehui Huang, Qi Feng, Qian Qian, et al. (2009) High-throughput genotyping by whole-genome resequencing. Genome Res. 19: 1068-1076.

6. Lu Wang, Wang Xuehui Huang and Bin Han et al. (2011) Mapping 49 quantitative trait loci at high resolution through sequencing-based genotyping of rice recombinant inbred lines. Theor Appl Genet 122:327–340.

7. Weibo Xie , Qi Feng , Huihui Yu , Xuehui Huang , Qiang Zhao , Yongzhong Xing , Sibin Yu , Bin Han ,and Qifa Zhang. (2010) Parent-independent genotyping for constructing an ultrahigh-density linkage map based on population sequencing. Proc. Natl Acad. Sci. USA, 107, 10578–10583.

8. Yongyong Shi1, Zhiqiang Li, Qi Xu, Ti Wang et al. (2011) Common variants on 8p12 and 1q24.2 confer risk of schizophrenia. Nat Genet 43(12):1224-7.

9. Haiman CA, Chen GK, Vachon CM, Canzian F. (2011) A common variant at the TERT-CLPTM1L locus is associated with estrogen receptor-negative breast cancer. Nat Genet. 43(12):1210-4.

10. Xuehui Huang, Xinghua Wei, Bin Han et al. (2010) Genome-wide association studies of 14 agronomic traits in rice landraces. Nature Genetics 42, 961–967

11. Xuehui Huang, Bin Han et al. (2011) Genome-wide association study of flowering time and grain yield traits in a worldwide collection of rice germplasm. Nature Genetics 44:32–39

12. Schneeberger, K., Ossowski, S., Weigel, D et al (2011) Reference-guided assembly of four diverse Arabidopsis thaliana genomes. Proc. Natl. Acad. Sci. USA 108, 10249-10254.

13. Cao, J., Schneeberger, K., Ossowski, S, Weigel, D et al. (2011) Whole-genome sequencing of multiple Arabidopsis thaliana populations. Nature Genetics 43, 956–963.

14. Magnus Nordborg, Detlef Weigel (2008) Next-generation genetics in plants. Nature 456, 720-723

15. Blake C. MeyersXuemei Chen, Yijun Qi, Detlef Weigel Jian-Kang Zhu et al. (2008) Criteria for Annotation of Plant MicroRNAs. The Plant Cell, Vol. 20: 3186–3190.

16. Yu X, Wang H, Lu Y, de Ruiter M, Cariaso M, Prins M, van Tunen A, He Y. (2011) Identification of conserved and novel microRNAs that are responsive to heat stress in Brassica rapa. J Exp Bot 63(2):1025-38.

17. Mi S, Cai T, Hu Y, Chen Y, Hodges E, Ni F, Wu L, Li S, Zhou H, Long C, Chen S, Hannon GJ, Qi Y.(2008) Sorting of small RNAs into Arabidopsis argonaute complexes is directed by the 5' terminal nucleotide. Cell.133(1):116-27

18. Charles Addo-Quaye, Tifani W. Eshoo, David P. Bartel, and Michael J. Axtell. (2008) Endogenous siRNA and miRNA Targets Identified by Sequencing of the Arabidopsis Degradome. Current Biology 18, 758–762

19. Jamalkandi SA, Masoudi-Nejad A.(2009) Reconstruction of Arabidopsis thaliana fully integrated small RNA pathway. Funct Integr Genomics.9(4):419-32.

20. Edwards Allen, Zhixin Xie Adam M. Gustafson, and James C. Carrington.(2005) microRNA-Directed Phasing during trans-Acting siRNA Biogenesis in Plants. Cell, Vol. 121, 207–221, April 22, 2005

21. Omar Borsani,1 Jianhua Zhu,1 Paul E. Verslues,1 Ramanjulu Sunkar, and Jian-Kang Zhu (2005). Endogenous siRNAs Derived from a Pair of Natural cis-Antisense Transcripts Regulate Salt Tolerance in Arabidopsis. Cell 123, 1279–1291

22. Gong, Z., Morales-Ruiz, T., Ariza, R.R., Roldan-Arjona, T., David, L., and Zhu, J.K. (2002). ROS1, a repressor of transcriptional gene silencing in Arabidopsis, encodes a DNA glycosylase/lyase. Cell 111, 803–814.

23. Ryan Lister, Ronan C. O’Malley, Julian Tonti-Filippini, Brian D. Gregory, Charles C. Berry,A. Harvey Millar, and Joseph R. (2008) Ecker. Highly Integrated Single-Base Resolution Maps of the Epigenome in Arabidopsis. Cell 133, 523–536

24. Shiba, H. et al. (2006) Dominance relationships between self-incompatibility alleles controlled by DNA methylation. Nature Genet. 38, 297–299.

25. Yoshiaki Tarutan et al. (2010) Trans-acting small RNA determines dominance

relationships in Brassica self-incompatibility. Nature (466):19

26. Vicki L. Chandler.(2010) Paramutation's Properties and Puzzles. Science 330, 628

27. Jianhua Zhu, Avnish Kapoor,Vaniyambadi V. Sridhar, Fernanda Agius,and Jian-Kang Zhu. (2007) The DNA Glycosylase/Lyase ROS1 Functions in Pruning DNA Methylation Patterns in Arabidopsis. Current Biology 17, 54–59

28. Jian-Kang Zhu. (2008) Epigenome Sequencing Comes of Age. Cell 133.

29. Melamed-Bessudo C, Levy AA. (2012) Deficiency in DNA methylation increases meiotic crossover rates in euchromatic but not in heterochromatic regions in Arabidopsis. Proc Natl Acad Sci U S A.;109(16):E981-8

30. Mirouze M, Lieberman-Lazarovich M, Aversano R, Bucher E, Nicolet J, Reinders J, Paszkowski J. (2012) Loss of DNA methylation affects the recombination landscape in Arabidopsis. Proc Natl Acad Sci U S A. 2012 Apr 10;109(15):5880-5

31. Eric J Richards.(2011) Natural epigenetic variation in plant species: a view from the field. Current Opinion in Plant Biology 2011, 14:204–209

32. The modENCODE Consortium (2010) Identification of Functional Elements and Regulatory Circuits by Drosophila modENCODE. Science. 330(6012): 1787–1797

33. Franc¸ois Roudier1, Ikhlak Ahmed et al.(2011) Integrative epigenomic mapping defines four main chromatin states in Arabidopsis. The EMBO Journal, 1–11

34. Suhua Feng and Steven E Jacobsen.(2011) Epigenetic modifications in plants: an evolutionary perspective. Current Opinion in Plant Biology 14:179–186

35. Jennifer E. Phillips1, and Victor G. Corces. (2009) CTCF: Master Weaver of the Genome. Cell 137.

36. Jeremy E. Wilusz, Hongjae Sunwoo and David L. Spector. (2009) Long noncoding RNAs: functional surprises from the RNA world. Genes Dev. 2009 23: 1494-1504

37. Fuquan Liu et al. (2010) Targeted 3’ Processing of Antisense Transcripts Triggers Arabidopsis FLC Chromatin Silencing. Science 327, 94

38. Jae Bok Heo and Sibum Sung.(2011). Vernalization-Mediated Epigenetic Silencing by a Long Intronic Noncoding RNA. Science 331, 76

39. Autran D, Baroux C et al. (2011). Maternal epigenetic pathways control parental contributions to Arabidopsis early embryogenesis.Cell. 145(5):707-19

40. Nodine MD, Bartel DP (2012). Maternal and paternal genomes contribute equally to the transcriptome of early plant embryos. Nature.;482 (7383):94-7

41. Mingyao Li, et al.2011Widespread RNA and DNA Sequence Differences in the Human Transcriptome. Science 333, 53

42. Li R, Li Y, Kristiansen K, Wang J. (2008) SOAP: short oligonucleotide alignment program.Bioinformatics.24(5):713-4

43. Li R, Yu C, Li Y, Lam TW, Yiu SM, Kristiansen K, Wang J(2009). SOAP2: an improved ultrafast tool for short read alignment.Bioinformatics. 25(15):1966-7

44. Heng Li and Richard Durbin. (2009) Fast and accurate short read alignment with BurrowsWheeler Transform. Bioinformatics. 26(5):589-95

45. Langmead,B. et al. (2009) Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biol., 10, R25.

46. Ben Langmead & Steven L Salzberg.(2012) Fast gapped-read alignment with Bowtie 2. nature methods (9) 4:357-359

47. Li H, Handsaker B, et al . (2009) The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25(16):2078-9

48. Robinson JT et al. Integrative genomics viewer. Nat Biotechnol. 29(1):24-6

49. Ruiqiang Li, Yingrui Li, Xiaodong Fang, et al.(2009) SNP detection for massively parallel whole-genome resequencing. Genome Res. 19(6):1124-32

50. Simola and Kim: Sniper: improved SNP discovery by multiply mapping deep sequenced reads. Genome Biology 2011 12:R55.

51. Trapnell C, Roberts A et al. (2012). Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. Nat Protoc. 7(3):562-78

52. Schulz MH, Zerbino DR, Vingron M, Birney E. (2012) Oases: robust de novo RNA-seq assembly across the dynamic range of expression levels. Bioinformatics. 28(8):1086-92

53. Li Y, Zheng H. et al (2011) Structural variation in two human genomes mapped at single-nucleotide resolution by whole genome de novo assembly. Nat Biotechnol. 29(8):723-30

54. Ji H, Jiang H, Ma W, Wong WH.(2011) Using CisGenome to analyze ChIP-chip and ChIP-seq data. Curr Protoc Bioinformatics. Chapter 2:Unit2.13

55. Rohde C, Zhang Y, Reinhardt R, Jeltsch A (2010) BISMA--fast and accurate bisulfite sequencing data analysis of individual clones from unique and repetitive sequences. BMC Bioinformatics.;11:230

56. Schadt EE, Turner S, Kasarskis A. (2010) A window into third-generation sequencing. Hum Mol Genet.19(R2):R227-40

 



https://m.sciencenet.cn/blog-539003-564212.html

上一篇:基于第二代测序技术所揭示的DNA/RNA世界和植物遗传学研究
下一篇:黄山行诗二首

4 柳海涛 丁承强 胡想顺 卢宏超

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-24 11:42

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部