科学网

 找回密码
  注册

tag 标签: 扁形虫基因组

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

PNAS:PacBio平台完成扁形虫基因组测序,揭秘不老神话
alinatingting 2015-12-4 15:54
高质量的全基因组组装结果和转录组注释信息(可以获得更全面的功能基因信息),对任何模式生物的充分研究和利用是非常重要的。今天要详细解析的是 Macrostomum lignano 这种扁形虫的基因组和转录组研究工作,这种扁形虫很奇妙,可以在切断之后,能够几乎完整地再生,即将一条扁形虫切成 10 段,可以获得 10 个几近完全一样的虫子来。希望可以通过解析扁形虫的基因组和转录组序列信息,能够揭秘其独特的再生机制,从而为干细胞的自我更新、再生和分化等研究奠定扎实的基础。 本研究由冷泉港实验室的Gregory J. Hannon( ku.ca.mac.kurc@nonnah.gerg )和Michael Schatz( ude.lhsc@ztahcsm )研究大牛领衔开展,于2015年10约6日发表在 PNAS 上。 一、Macrostomum lignano 扁形虫及基因组特点 : 冠轮动物,雌雄同体。 独特的生物学特点:受伤时可再生;饥饿时可减缓生长。 2n=8 ; 基因大小: ~700Mb ; 基因组特点: 75% 的序列为简单重复序列和转座子序列。 二、实验与材料: 测序品系 : Macrostomum lignano DV1 line ,经 35 代同胞杂交;一直培养在富含营养的 f/2 培养基中,气温 20 ℃ 、湿度 60% 、光周期 14/10h day/night 循环;菱形藻( Nitzschia curvilineata )喂食。 再生实验 :切断位置为后咽后,为确保完全去除性腺组织。后咽前一部分放在上述条件下喂养;分别在切割后的 0h,3h, 6h, 12h, 24h, 48h 和 72h 搜集扁形虫,共搜集获得 100 条扁形虫。 三、基因组测序 : HiSeq 平台测序:构建 180bp shotgun 文库经 HiSeq 2000 100PE 测序 170X 。 PacBio 测序:文库大小 10Kb , PacBio RS II 平台 P4C2 或 P5C3 试剂盒测序 ~130X ,经过错误校正后其中大于 10Kb 的 reads 覆盖 21X 。 四、RNA 测序 : a. 整条虫子转录组测序, 200-400 条扁形虫, TRIzol(Ambion) 提取总 RNA ;分别构建了三个不同类型的文库: 第一个文库是用总 RNA 构建的; 第二个文库是基于 rRNA-depleted RNA (Ribo-Gold Epibio) 构建的; 第三个文库是基于 polyA-selected RNA (Poly(A)Purist MAG kit, Life Technologies) 构建的 b. 关于再生这块的 RNA 文库构建,是采用 Encore Complete RNA-Seq DR Multiplex System ( PCR-free )构建的,共构建了两个文库。 上述文库通过 HiSeq 2000 101PE 测序完成。 五、小 RNA 测序 : 文章没有详细介绍这部分实验,但在分析环节提到了。 六、甲基化测序 :使用 Zymo EZmethylation gold kit 进行亚硫酸氢钠转化, illumina 平台测序。 七、信息分析内容 : 1. 转录组 de novo 组装及注释 : 1 ) Trinity package denovo 组装; The libraries included in the assembly were: total RNA prepared from 100 worms, polyA- selected RNA, ribo-depleted RNA (see above). 2 )转录本 denovo 注释: 先和数据库 SwissProt 和 Uniref90 (是全球蛋白数据库 UniProt 的组成部分)数据库进行 blast ; 然后用 HMMER v3.1b2 ( http://hmmer.janelia.org/ ) 中的 Pfam-A hmm 进行分析; 将上述分析结果下载到一个 sqlite database 中,最后通过 Trinotate pipeline 分析。 3 )转录组差异表达分析:将不同再生时间节点的转录本序列信息分别比对至上述转录组组装结果上进行差异表达分析,比对软件为 RSEM (Li and Dewey 2011) ;差异表达分析软件为 DESEq ( false-discovery rate ≤ 0.001, with aminimum fourfold change ) 2. 基因组 de novo 组装和注释 : 1 )二代数据拼接:针对 HiSeq 数据( 115X )进行 denovo 组装,组装软件为: SGA (github https://github.com/jts/sga );仅保留长度 ≥200bp 以上的 contigs (基于左右端 reads 长度加起来已有 200bp 为考虑),此为 ML1 组装结果。如下图: Thefirst assembly draft, the ML1 assembly, had a very unusual four-modal K-mer distribution (Fig. 2A), suggesting a high frequency ofgenomic duplications (peaks 3 and 4). 图中表明基因组重复序列比例很高(见 peak3 和 peak4 ),基于上述数据尝试组装获得 ML1 版本,非常片段化, contig 平均长度仅 532bp ; contig N50 仅 222bp ,最大的 contig 长度仅 144 Kbp 。 2 )三代数据拼接:针对 PacBio 数据,采用 HGAP ( https://github.com/PacificBiosciences/HBAR-DTK ) 进行校正,仅长度大于 10Kb 的 reads 用于校正中;数据校正之后,采用 Celera Assembler v8.2beta 进行组装获得 ML2 组装结果。采用 PacBio RS II reads 组装结果 ML2 长度大大提升(详见下图),包括从 contig N50 从 222bp 提升至 64Kb ,最长的 contig 长度从 144Kb 提升至 627Kb 。下图是 ML1 和 ML2 结果比较: Contig length distribution (log 2 scale) over the M. lignano genome in the ML1 (green) and ML2 (red) assemblies. Note that the ML1 assembly covers only about 55% of the genome . 3 )随机抽取 ML1 组装结果中的 81665 contigs (约占 ML1 的 10% )通过 Mummer v. 3.23 比对至 ML2 组装结果上,获得 per-base identity 的结果报告。 4 ) NR 数据库比对以去除其他物种(如硅藻等)的序列,仅 e-value 值为 1e-10 及以下的 contigs 予以保留。结果再通过 LIS algorithm 进行过滤。数据库比对结果发现扁形虫中的序列比对至 Caenorhabditis remanei 线虫的是最多的,表明扁形虫有和其他虫类等同源的基因。 5 )基因组注释: a. CEGMA 评估 gene space , 248 个保守的真核基因中, 232 (93.55%) 全部比对、 246 (99.19%) 部分比对至扁形虫的基因组组装结果中,表明组装结果中 gene space 是很好的,但是组装子中的非编码区段很片段化,这可能是因基因组中高频率的 low-complexity and tandem repeats 所导致的。 b. 采用 Maker v2.31.8 (Dec 2014) 进行功能基因注释。 6 )基因组组装结果验证: BAC 文库构建及测序 构建 BAC 文库获得 60,000 BACs ( insert size ~20Kb )和 60,000 BACs ( insert size of ~50Kb ) ,HiSeq 2000 100PE 测序,去除比对至 BAC backbone 和大肠杆菌的序列,余下的序列通过 Bowtie 2 (v2.2.3) 比对至 ML2 组装结果上。 4. 转座子序列分析 : 采用 RepeatScout version 1.0.5 分别对 ML1 和 ML2 组装结果进行分析。仅将在基因组中出现 10 次以上的重复序列用于后续分析。然后重复序列注释 a custom non-redundant library fromNCBI entries (keywords: retrotransposon, transposase, reverse transcriptase,gypsy, copia) obtained from O. Simakov and colleagues. 5. 序列复杂度分析 Sequence Complexity Analysis ; 6. 评估 CpG content ; 7. 甲基化测序 reads 分析 :将甲基化测序 reads mapping 到 ML2 组装结果上。 更多信息请查看文献: Genome and transcriptome of the regeneration-competent flatworm, Macrostomum lignano.pdf 下载SI信息: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4603488/ 。 附作者信息: Kaja Wasik , a, 1 James Gurtowski , a, 1 Xin Zhou , a, b Olivia Mendivil Ramos , a M. Joaquina Delás , a, c Giorgia Battistoni , a, c Osama El Demerdash , a Ilaria Falciatori , a, c Dita B. Vizoso , d Andrew D. Smith , e Peter Ladurner , f Lukas Schärer , d W. Richard McCombie , a Gregory J. Hannon , a, c, 2 and Michael Schatz a, 2 a Watson School of Biological Sciences, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY, 11724; b Molecular and Cellular Biology Graduate Program, Stony Brook University, NY, 11794; c Cancer Research UK Cambridge Institute, University of Cambridge, Cambridge CB2 0RE, United Kingdom; d Department of Evolutionary Biology, Zoological Institute, University of Basel, 4051 Basel, Switzerland; e Department of Molecular and Computational Biology, University of Southern California, Los Angeles, CA, 90089; f Department of Evolutionary Biology, Institute of Zoology and Center for Molecular Biosciences Innsbruck, University of Innsbruck, A-6020 Innsbruck, Austria 2 To whom correspondence may be addressed. Email: ku.ca.mac.kurc@nonnah.gerg or ; Email: ude.lhsc@ztahcsm . Contributed by Gregory J. Hannon, August 23, 2015 (sent for review June 25, 2015; reviewed by Ian Korf and Robert E. Steele)
个人分类: 动物基因组测序研究进展|6846 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-16 19:53

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部