科学网—标签 - 高通量测序

相关帖子	版块	作者	回复/查看	最后发表

热度 6 SNPs 2013-11-22 05:52

几天前，Illumina公司的小型高通量测序仪MiSeqDx获得了美国FDA的批准。美国NIH主任Francis Collins还特地在当天写了一篇文章，发表在新英格兰医学杂志上（点击连接全文）： Francis能在百忙之中抽出时间来写一篇“社论”，可见这个报批具有里程碑样的长远影响：（1）首先，他不忘“揽功”，认为这是十多年前NIH赞助的结果。的确，当年人类基因组计划起步的时候，他们就很有远见地意识到，靠当时的技术肯定无法按时完成任务。于是，在人类基因组工程项目拨款中有一定比例是要投入到新的基因组测序技术的开发。斯坦福大学的人类基因组技术中心就是基因组技术开发的重点单位之一。没有当时的播种，就不会有今天的收获。（2）他随后介绍了高通量技术的使用前景，也讨论了该技术被转化成真正的临床服务还有哪些困难。也从谈了从政府的角度，不同部门之间（NIH, FDA, 和国家技术与标准化研究院）如何合作建立技术评估体系的。（3）在遗传信息使用方面的相关立法也是Francis非常关心的问题。几年前他访问HudsonAlpha的时候刚好获知国会通过了有关遗传信息免歧视的法律，那是他多年努力的结果，不然有了技术，没有配套的法律也不行。 “The arrival of next-generation sequencing at this regulatory landmark is only the beginning. We need to work together to ensure that research progresses, that regulatory policies are developed, that patients' rights and needs are addressed, and that clinical use of genomic information is based on rigorous evidence.” MiSeqDx获得FDA批准，说明高通量测序已经进入临床，这是一个历史性的时刻。这个时刻以后，我们就要少关心“怎么测？”的问题，而要更多地关心 “测什么？” 的问题了。怎么测是技术平台问题，而测什么就是“内容”的问题了。这里面的机会很多，包括科研和创业的机会。记得我还是研究生的时候，人类基因组计划开始实施，我当初非常遗憾自己错过了亲身参与的机会。现在，一个机会有摆在我们面前，能把握住这个机会是我们这代人的责任和机遇，错过了这个机会，我们会遗憾终生。所以我们每个人都应该冷静地想想，“这里面是否有属于我的机会？” 相关博客：斯坦福大学人类基因组技术中心的故事美国在人类基因组工程上赚了多少钱？高通量测序距离临床应用还有多远？高通量测序：不再问“如何测？”，而要问“测什么？” 我要革命！革现有诊断技术的命！

个人分类: 生物技术创新创业|13056 次阅读|9 个评论

生命是可以测量的——那些已发表动植物基因组

热度 31 xudabin98 2013-9-13 21:42

已发表基因组文章的物种汇总资料2013.09-06.xls 在分子生物学领域的“圈内人”，如果还不了解全基因组测序的飞速发展，用娃娃的话说，那真是一个“奥特曼”了。高通量测序技术出现掀开了生命科学研究的新篇章，促进了许多研究方向的的复苏和蓬勃发展，同时也涌现了一些交叉学科。 2011 年德国爆发急性肠出血性流行病疫情——极大困扰着英国剑桥市新生儿护理病房的医护人员。来自 Sanger 研究院的研究人员从多个患者身上取样，并采用 Illumina MiSeq 进行全基因组测序。通过生物信息学分析得知，在疫情爆发过程中发生了一系列小规模突变，流行病学家据此绘制出一个进化树，追踪疫情逐步靠近可疑的源头。文章作者 Julian Parkhill 表示：“基因测序提供了明晰的线索，这是其他方法难以做到的。”文章发表在流行病学顶级杂志 The Lancet Infectious Diseases 。 2012 年发表在 science 杂志旗下 Science Translational Medicine 另外一篇文章也同样表明了全基因组测序技术在流行病学中重要作用。位于马里兰州贝塞斯达市医疗中心出现了严重的血液传染病事件，在此次事件中，共有 17 名病人感染了血液传染病，并造成 6 人死亡。来自美国 NIH 人类基因组研究所的研究人员从病人体内和医院一些设备上采集了细菌样本，并对不同菌株的基因组进行测序。通过对突变菌株进行聚类分析，将病人分组，再结合病例住院的记录（入院时间、所在病房等）画出了最可能的传播路线。全基因组测序提供的详尽细节让传染病学家们真正地理解了疾病传播途径，详尽的追踪技术将带来更加完善的公共健康领域内的传染病学研究。所以流行病学家更有可能找到事件发生的真正原因，而非最简单的原因。这两件事让我们真实的看到了全基因组测序在流行病学的重要作用。事实上，媲美曼哈顿和登月计划的“人类基因组计划”所带来的巨大作用正在逐渐显现，高通量测序技术走向个性化医疗已是大势所趋。全基因组测序使得生命可以测量，人们可以更加方便快捷的了解生命的奥秘。目前已发表基因组序列的物种如下，对于进一步解析其生命活动提供了极大帮助。植物基因组中文名发表时间刊物 IF 基因组大小主要研究单位拟南芥 2000.12 Nature 34.48 125Mb 欧美科学家共同完成水稻 2002.04 Science 29.747 466Mb 中科院遗传所等水稻 2002.04 Science 29.747 467Mb Torrey Mesa Research Institute 杨树 2006.09 Science 29.747 480Mb 美国橡树岭国家实验室等葡萄 2007.09 Nature 34.48 490Mb 法国 Genoscope 国家基因测序中心等衣藻 2007.01 Science 29.747 130 Mb 美国加利福尼亚大学等小立碗藓 2008.01 Science 29.747 480Mb 德国弗莱堡大学等番木瓜 2008.04 Nature 34.48 370Mb 美国夏威夷农业研究中心等三角褐指藻 2008.11 Nature 34.48 27.4Mb 法国国家科学研究院等高粱 2009.01 Nature 34.48 730Mb 美国乔治亚大学等玉米 2009.11 Science 29.747 2300Mb 美国爱荷华州立大学等黄瓜 2009.11 Nature Genetics 34.284 350Mb 中国农科院蔬菜花卉研究所等大豆 2010.01 Nature 34.48 1100Mb 美国HudsonAlpha基因组测序中心等二穗短柄草 2010.02 Nature 34.48 260Mb 国际短柄草研究协会（ IBI ）褐藻 2010.06 Nature 34.48 196Mb 巴黎匹兹堡大学医学中心等团藻 2010.07 Science 29.747 138Mb 美国能源部联合基因组研究所等蓖麻 2010.08 Nature Biotechnology 29.495 350Mb 美国 JCV 等小球藻 2010.09 Plant Cell 9.293 46Mb 法国埃克斯马赛大学等苹果 2010.09 Nature Genetics 34.284 742Mb 意大利农业研究所等森林草莓 2010.12 Nature Genetics 34.284 240Mb 美国北德克萨斯大学等可可树 2010.12 Nature Genetics 34.284 430-Mb 法国 CIRAD 等野生大豆 2010.12 PNAS 9.432 915.4 Mb 韩国首尔国立大学等褐潮藻类 2011.02 PNAS 9.432 57Mb 美国纽约州立大学石溪分校等麻风树 2010.12 DNA Res. 3.525 410Mb 日本千叶县上总 DNA 研究所等卷柏 2011.05 Science 29.747 212Mb 美国普度大学等枣椰树 2011.05 Nature biotechnology 29.495 685Mb 卡塔尔威尔康奈尔医学院等琴叶拟南芥 2011.05 Nature Genetics 34.284 206.7 Mb 美国南加州大学马铃薯 2011.07 Nature 34.48 844Mb BGI 、中国农科院蔬菜花会所等条叶蓝芥 2011.08 Nature Genetics 34.284 140Mb 伊利诺伊大学等白菜 2011.08 Nature Genetics 34.284 485Mb 中国农科院蔬菜花会所等印度大麻 2011.10 Genome biology 6.89 534Mb National Research Council of Canada, 木豆 2011.11 Nature biotechnology 29.495 833Mb 国际半干旱地区热带作物研究所等蒺藜苜蓿 2011.11 Nature 34.48 500Mb 美国明尼苏达大学等蓝载藻（灰胞藻门） 2012.02 Science 29.747 70Mb 美国罗格斯大学等粟（谷子） 2012.05 Nature biotechnology 29.495 423 Mb BGI和张家口市农业科学院等番茄 2012.05 Nature 34.48 760Mb 美国康奈尔大学等甜瓜 2012.07 PNAS 9.432 375Mb 西班牙的九个研究中心香蕉 2012.07 Nature 34.48 523Mb 法国 CIRAD 等棉花 2012.08 Nature Genetics 34.284 775Mb 农科院，北大，华大基因大麦 2012.10 Nature 34.48 5.1Gb 国际大麦基因组协作组织梨 2012.11 Genome Research 13.608 527Mb 南京农业大学等西瓜 2012.11 Nature Genetics 34.284 425Mb 北京农林科学研究院等甜橙 2012.11 Nature Genetics 34.284 367Mb 华中农业大学等小麦 2012.11 Nature 34.48 17Gb 利物浦大学等梅花 2012.12 Nature Communication 7.396 280Mb 北京林业大学等鹰嘴豆 2013.1 Nature Biotechnology 29.425 738Mb 印度 ICRISAT 毛竹 2013.2 Nature Genetics 34.284 2.075G 中国林业科学研究院林业研究所角叉菜 2013.2 PNAS 9.681 105Mb 国国家科学研究中心等小麦A基因组 2013.3 Nature 34.48 4.94Gb 中国科学院遗传与发育生物学研究所等小麦D基因组 2013.3 Nature 34.48 4.36Gb 中国农科院作物科学研究所等桃树 2013.3 Nature Genetics 34.284 265Mb 国际桃基因组计划协作组短花药野生稻 2013.3 Nature Communication 7.396 261Mb 中科院遗传与发育生物学研究所等莲 2013.5.10 Genome biology 9.04 929Mb 武汉植物园枣椰树 2013.8.6 Nature Communications 10.015 605.4Mb 中科院北京基因组研究所动物基因组　　　　　中文名发表时间刊物刊物基因组大小主要研究者及国家秀丽隐杆线虫 1998.12 Science 29.747 97Mb The C. elegans Sequencing Consortium 果蝇 2000.03 Science 29.747 120Mb Celera Genomics等冈比亚按蚊 2002.10 Science 29.747 280Mb 美国塞雷拉基因组公司等小家鼠 2002.12 Nature 34.48 2.5 Gb Mouse Genome Sequencing Consortium 红鳍东方豚 2002.12 Science 29.747 380Mb 新加坡分子与细胞生物学研究院等玻璃海鞘 2002.12 Science 29.747 150Mb 美国能源部JGI等线虫 2003.11 PLoS Biology 13.501 104Mb 美国冷泉港等褐家鼠 2004.04 Nature 34.48 2.75 Gb 美国得克萨斯州贝勒医学院等黑斑鲀 2004.10 Nature 34.48 340Mb 法国、西班牙、美国家蚕 2004.12 Science 29.747 428.7 Mb 西南大学等鸡 2004.12 Nature 34.48 1.06Gb 中国华大基因等克氏锥虫 2005.07 Science 29.747 67Mb 美国罗克维尔市基因组研究院等黑猩猩 2005.09 Nature 34.48 2.7Gb 美国哈佛-麻省理工的博德研究所等狗 2005.12 Nature 34.48 2.5 Gb 美国哈佛-麻省理工的博德研究所等意蜂 2006.10 Nature 34.48 236Mb 人类基因组测序中心等海胆 2006.11 Science 29.747 1Gb 人类基因组测序中心等姥鲨 2007.04 Plos Biology 13.501 0.91Gb 新加坡分子与细胞生物学研究院等猕猴 2007.04 Science 29.747 2.87Gb 人类基因组测序中心等短尾负鼠 2007.05 Nature 34.48 3.4Gb 美国哈佛-麻省理工的博德研究所等青鳉鱼 2007.06 Nature 34.48 700Mb 日本东京大学等伊蚊 2007.06 Science 29.747 1376Mb 美国MCD基因组研究院等马来线虫 2007.07 Science 29.747 90Mb 美国匹兹堡大学等海葵 2007.07 Science 29.747 357Mb 美国JGI能源部等猫 2007.11 Genome Research 11.2 2.7Gb 马里兰州国立癌症研究所等赤拟谷盗 2008.04 Nature 34.48 204Mb 人类基因组测序中心等鸭嘴兽 2008.05 Nature 34.48 1.84Gb 美国华盛顿大学等文昌鱼 2008.06 Nature 34.48 520Mb 美国JGI能源中心等丝盘虫 2008.08 Nature 34.48 104Mb 美国加利福尼亚大学等南方根瘤线虫 2008.08 Nature Biotechnology 29.495 86Mb I法国国家农业研究所等古猛犸象 2008.11 Nature 34.48 4.7Gb 美国宾夕法尼亚州立大学等牛 2009.04 Science 29.747 2.87 Gb 人类基因组测序中心等曼氏血吸虫 2009.07 Nature 34.48 360Mb Sanger研究院等日本血吸虫 2009.07 Nature 34.48 397Mb 中国国家人类基因组中心等马 2009.11 Science 29.747 2.7Gb 美国博德研究所等熊猫 2010.01 Nature 34.48 2.25Gb 深圳华大基因研究院金小蜂 2010.01 Science 29.747 295Mb 美国罗切斯特大学等豌豆蚜虫 2010.02 PLoS Biol. 13.501 517Mb 国际蚜虫基因组协会水螅 2010.03 Nature 34.48 1.05Gb 美国 JGI 能源部等非洲爪蟾 2010.04 Science 29.747 1.7 Gb 美国JGI能源部等珍珠鸟 2010.04 Nature 34.48 1.2Gb 美国华盛顿大学等人类体虱 2010.07 PNAS 9.432 110Mb 美国伊利诺斯大学等海绵 2010.08 Nature 34.48 190Mb 美国加利福尼亚大学等蚂蚁 2010.08 Science 29.747 C. floridanus240 Mbb; H. saltator330 Mbb 纽约大学等火鸡 2010.09 PLoS Biology 13.501 1.1 Gbb 美国动物家禽科学部等库蚊 2010.10 Nature 34.48 540Mb 美国加州大学河滨分校等异体住囊虫 2010.11 Science 29.747 148Mb 法国CEA等红毛猩猩 2011.01 Nature 34.48 3.09Gb 美国华盛顿大学基因组中心等阿根廷蚁 2011.01 PNAS 9.432 250.8Mb 美国旧金山大学等红色收割蚁 2011.01 PNAS 9.432 250–284 Mb 美国里士满厄尔汉学院等火蚁 2011.01 PNAS 9.432 484.2Mb 瑞士洛桑大学等水蚤 2011.02 Science 29.747 200Mb 美国印第安纳大学等大头切叶蚁 2011.02 PLoS Genetics 9.532 300Mb 美国威斯康星-麦迪逊大学等旋毛虫 2011.02 Nature Genetics 34.284 64Mb 美国华盛顿大学医学院等袋獾 2011.06 PNAS 9.432 3.3Gb 澳大利亚罗伊癌症研究中心等顶切叶蚁 2011.06 Genome Research 11.2 313Mb 哥本哈根大学等鹿角珊瑚 2011.07 Nature 34.48 420Mb 日本冲绳县科学与技术研究所等缅甸蟒 2011.07 Genome Biology 6.89 1.4Gb 科罗拉多大学医学院等大西洋鳕鱼 2011.08 Nature 34.48 830Mb 挪威奥斯陆大学等澳大利亚袋鼠 2011.08 Genome Biology 6.89 2.9Gb 澳大利亚袋鼠基因组研究中心等绿蜥蜴 2011.09 Nature 34.48 1.78Gb 美国哈佛 - 麻省理工的博德研究所等裸鼹鼠 2011.10 Nature 34.48 2.6Gb 韩国梨花女子大学等食蟹猴和中国恒河猴 2011.10 Nature Biotechnology 29.495 2.85Gb 中山大学、 BGI 等猪蛔虫 2011.10 Nature 34.48 272Mb BGI，墨尔本大学等二斑叶螨 ( 棉红蜘蛛 ) 2011.11 Nature 34.48 90Mb 西安大略大学等帝王蝶 2011.11 Cell 31.152 273Mb 马萨诸塞大学医学院、等指猴 ( 夜狐猴 ) 2011.12 Genome Biology and Evolution 2.674 3Gb 芝加哥大学、维尔康奈尔医学院埃及血吸虫 2012.01 Nature Genetics 34.284 385Mb BGI、墨尔本大学等鳄鱼 2012.01 Genome Biology 6.89 2.5Gb 加利福尼亚大学、佛罗里达大学等大猩猩 2012.03 Nature 34.48 3.04Gb 英国韦尔科姆基金会桑格研究所等马氏珠母贝 2012.04 DNAresearch 3.525 1.15Gb 日本冲绳县科学与技术研究所等诗神袖蝶 2012.05 Nature 34.48 269Mb 伦敦大学学院、剑桥大学等倭黑猩猩 2012.06 Nature 34.48 3Gb 德国马克斯 • 普朗克人类进化研究所等牦牛 2012.07 Nature genetics 34.48 2.6Gb 华大基因牡蛎 2012.09 Nature 34.48 559Mb 中国科学院海洋所等双峰骆驼 2012.11 Nature Communication 7.396 2.38Gb 内蒙古大学等猪 2012.11 Nature 34.48 2.6Gb 国际家猪基因组测序协作组中央狐蝠 2012.12 Science 31.201 2Gb 深圳华大基因研究院等大卫鼠耳蝠 2012.12 Science 31.201 2Gb 深圳华大基因研究院等山羊 2012.12 Nature Biotechnology 29.425 2.66Gb 昆明动物所等海洋蠕虫 2012.12 Nature 34.48 324Mb 莱斯大学等淡水水蛭 2012.12 Nature 34.48 228Mb 莱斯大学等青螺 2012.12 Nature 34.48 348Mb 莱斯大学等小菜蛾 2013.1 Nature Genetics 34.284 339.4Mb 福建农林大学等家鸽 2013.1 Science 31.201 1.3Gb 犹他大学等中国树鼩 2013.2 Nature Communication 7.396 3.2Gb(2.86G bassembled) 中科院昆明动物所等海七鳃鳗 2013.2 Nature Genetics 34.284 816Mb 美国海洋生物学实验室等非洲眼丝虫 2013.3 Nature Genetics 34.284 91.4Mb 美国国立卫生研究院等游隼/猎隼 2013.3 Nature Genetics 34.284 1.2Gb 英国卡迪夫大学等西部锦龟 2013.3 Genome Biology 9.04 2.59Gb 美国加州大学等绦虫 2013.3 Nature 34.48 115Mb-141Mb Sanger 研究院等腔棘鱼 2013.4 Nature 34.48 2.18Gb 美国 Benaroya 研究所等剑尾鱼 2013.3.31 Nature Genetics 34.284 669Mb 华盛顿大学医学院等斑马鱼 41381 Nature 34.48 1.412Gb 英国桑格研究院中华鳖和绿海龟 2013.4.28 Nature Genetics 34.284 2.21Gb/2.24Gb 深圳华大基因研究院藏羚羊 2013.5 Nature Communication 7.396 2.75Gb 青海大学等鸭 2013.6.09 Nature Genetics 34.284 1.1GB 中国农业大学等蚊子 2013.6.12 Nucleic Acids Research 8.278 201Mb 美国加州大学尔湾分校等地山雀 2013.7.1 Nature Communication 10.015 1.086Gb 中科院动物研究所、诺禾致源黑线仓鼠 2013.7.21 Nature Biotechnology 32.438 2.7G 深圳华大基因研究院扬子鳄 2013.8.06 Cell research 10.526 2.3G 浙江大学等蛭形轮虫 2013.8.22 Nature 38.597 244Mb 美国那慕尔大学等资料整理由北京诺禾致源生物信息科技有限公司惠远远提供，致谢！

21776 次阅读|76 个评论

选择合适高通量测序公司一点建议

热度 8 xudabin98 2013-8-4 22:13

从基因组、转录组、表观基因组、调控组、宏基因组等各个生物层面上对生物体进行信息解读，是理解复杂生命机理的关键。新一代测序技术的飞速发展，为我们从各个角度观测生命系统提供了可能。新一代测序技术又称高通量测序，是对第一代DNA 测序技术颠覆性革命，以2005 年454 公司推出基于焦磷酸测序技术的454 测序仪为标志，代表着新一代测序技术的推广和应用。随后的2006 年，美国Illumina 公司进军新一代DNA 测序市场，研发出了自己测序平台—Solexa 测序仪。2007 年，美国ABI 公司也推出了他们的第二代测序平台—SOLiD 测序仪。目前这三大测序平台是普遍使用的DNA 测序仪，从市场销售情况来看，illumina 测序仪成为测序领域主流。每年发表的测序文章中，基于illumina 测序平台占了绝大部分。高通量测序技术的风起云涌，测序价格的一降再降，各个测序公司的激烈竞争，使得新一代测序已然成为分子生物学实验室中的平民化工具。该技术极大推动了生命科学的发展，让人们可以更方便快捷地洞察生物学的奥秘。由于仪器设备和专业的生物信息分析团队限制，很多老师的项目都只能与公司合作。现在市场上与测序相关公司近百家，虽然高通量测序本身是一项高端技术，需要一定的实力，但跟其他行业一样，也是鱼龙混杂、泥沙俱下，因此选择合适的测序方案，性价比高的测序公司对项目的顺利开展至关重要。与各位老师接触的过程中，发现了一些问题，整理一下作为给即将利用该技术老师一个参考。首先是公司的选择。对于任何一家公司都有其优势和不足，选择时主要有两点可供参考：第一该公司是否有自己的测序平台？目前有自己测序平台的公司并不多，如果没有自己的测序平台，争取到项目后就要交给别的公司去测序，这样在测序质量和项目周期上就没法保证，有时会严重耽误项目的进程，延误文章的发表，甚至被别人抢发。光有测序平台还不成，还要看是什么样的测序平台？很多老师都有个误区，觉得测序质量各个公司都差不多，其实这样的想法是不正确的。不同的测序平台数据质量和产出量是不一样的，甚至同样的Hiseq2000 测序平台，前年买的和今年买的测序仪在测序质量上都会有一定出入。可以让公司提供已完成项目的数据Q30 和Q20 ，作为一个参考，公司自己制定其他数据评判标准与标准的Q30 是两个概念，结果很漂亮但不代表真实数据质量。第二是公司是否有强大的生物分析团队？有时花了不菲的价格，测了一堆数据，却无法完成后续数据挖掘分析，将其转化成可靠的结果，只能困在电脑里面，眼看着数据资源的优势在一点点流逝而毫无办法。曾经碰到一个老师，测了上百张生物芯片的数据，却没有给分析出结果，守着一堆数据不断找公司进行后续挖掘。生物信息分析不是简单的跑跑流程，靠某一软件进行简单基因功能预测，这样得出的结果到底有多大的可信度，没人敢保证。比如基因组从头测序，目前有很多公司提供该项服务，但真正有实力做好这项工作的公司有几家？从公司有无从头测序文章，文章发在什么杂志上就能知道这家公司是否有雄厚的生物信息分析功底，是否可以做相关项目。其次是价格的衡量。无论什么样的交易，价格永远是核心问题中的核心。俗话说，一分钱一分货，便宜的但不一定是好的。比如说同样的4Gb 转录组测序分析，不同的公司价格相差很多，这是为什么？站在老师的角度，可以考虑一下几点。样品检测是否使用了目前标准的四种检测方法，并将检测报告及时发送给老师？测序文库构建是否采用了illumina Truseq RNA/Samll RNA Sample Pre Kit 及其推荐的配套试剂，而不是使用其他试剂公司提供的配套试剂？比如说有的公司会说建库按照illumina Truseq RNA 指定方法进行建库，这里面就存在着问题，可能是采用了illumina Truseq RNA 的protocol ，但并没有采用原装试剂。如果样品的质量和建库质量无法保证，会从数据源头上导致低丰度转录本信息的丢失和数据偏好性。替代试剂的采用虽然降低了成本，但同时也降低了测序质量。4Gb 的数据质量是clean data 还是Raw data 。clean data 是指除去了接头及低质量序列的数据，跟raw data 完全两码事。同样，后面生物信息分析要看公司提供的仅仅是简单跑流程，还是根据科研目标，选择分析软件，调整参数，对结果提出合理的解释，给出最出色的问题解决方案。最后是后续服务。合同没有签时，可能将老师当上帝，小心伺候着。但一旦签了合同，打了项目款，后面就没有了保证。最后结题报告发给老师，如何解读报告以及相关问题，可能连人都找不到了，因此后续服务也是非常重要的一点。以上是自己工作时的一点感悟，希望能够给各位准备或者打算做高通量测序老师和同学一些参考。我会随时更新这篇博文，将相关问题罗列出来，在做相关项目时少走或者不走弯路。于北京诺禾致源生物信息科技有限公司

22100 次阅读|10 个评论

[转载]高通量测序领域基础知识（摘自百度）

wangpingxi2009 2013-7-10 10:31

什么是高通量测序？高通量测序技术（ High-throughput sequencing ， HTS ）是对传统 Sanger 测序（称为一代测序技术）革命性的改变 , 一次对几十万到几百万条核酸分子进行序列测定 , 因此在有些文献中称其为下一代测序技术 (next generation sequencing ， NGS ) 足见其划时代的改变 , 同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能 , 所以又被称为深度测序 (Deep sequencing) 。什么是Sanger法测序（一代测序） Sanger 法测序利用一种DNA聚合酶来延伸结合在待定序列模板上的引物，直到掺入一种链终止核苷酸为止。每一次序列测定由一套四个单独的反应构成，每个反应含有所有四种脱氧核苷酸三磷酸(dNTP)，并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。由于ddNTP缺乏延伸所需要的3-OH基团，使延长的寡聚核苷酸选择性地在G、A、T或C处终止。终止点由反应中相应的双脱氧而定。每一种dNTPs和ddNTPs的相对浓度可以调整，使反应得到一组长几百至几千碱基的链终止产物。它们具有共同的起始点，但终止在不同的的核苷酸上，可通过高分辨率变性凝胶电泳分离大小不同的片段，凝胶处理后可用X-光胶片放射自显影或非同位素标记进行检测。什么是基因组重测序（ Genome Re-sequencing ）全基因组重测序是对基因组序列已知的个体进行基因组测序，并在个体或群体水平上进行差异性分析的方法。随着基因组测序成本的不断降低，人类疾病的致病突变研究由外显子区域扩大到全基因组范围。通过构建不同长度的插入片段文库和短序列、双末端测序相结合的策略进行高通量测序，实现在全基因组水平上检测疾病关联的常见、低频、甚至是罕见的突变位点，以及结构变异等，具有重大的科研和产业价值。什么是 de novo 测序 de novo 测序也称为从头测序：其不需要任何现有的序列资料就可以对某个物种进行测序，利用生物信息学分析手段对序列进行拼接，组装，从而获得该物种的基因组图谱。获得一个物种的全基因组序列是加快对此物种了解的重要捷径。随着新一代测序技术的飞速发展，基因组测序所需的成本和时间较传统技术都大大降低，大规模基因组测序渐入佳境，基因组学研究也迎来新的发展契机和革命性突破。利用新一代高通量、高效率测序技术以及强大的生物信息分析能力，可以高效、低成本地测定并分析所有生物的基因组序列。什么是外显子测序（ whole exon sequencing ）外显子组测序是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。外显子测序相对于基因组重测序成本较低，对研究已知基因的SNP、Indel等具有较大的优势，但无法研究基因组结构变异如染色体断裂重组等。什么是mRNA测序（RNA-seq）转录组学（transcriptomics）是在基因组学后新兴的一门学科，即研究特定细胞在某一功能状态下所能转录出来的所有RNA（包括mRNA和非编码RNA）的类型与拷贝数。 Illumina提供的mRNA测序技术可在整个mRNA领域进行各种相关研究和新的发现。mRNA测序不对引物或探针进行设计，可自由提供关于转录的客观和权威信息。研究人员仅需要一次试验即可快速生成完整的poly-A尾的RNA完整序列信息，并分析基因表达、cSNP、全新的转录、全新异构体、剪接位点、等位基因特异性表达和罕见转录等最全面的转录组信息。简单的样品制备和数据分析软件支持在所有物种中的mRNA测序研究。什么是 small RNA 测序 SmallRNA （microRNAs、siRNAs和 pi RNAs）是生命活动重要的调控因子，在基因表达调控、生物个体发育、代谢及疾病的发生等生理过程中起着重要的作用。Illumina能够对细胞或者组织中的全部Small RNA进行深度测序及定量分析等研究。实验时首先将18-30 nt范围的Small RNA从总RNA中分离出来，两端分别加上特定接头后体外反转录做成cDNA再做进一步处理后，利用测序仪对DNA片段进行单向末端直接测序。通过Illumina对Small RNA大规模测序分析，可以从中获得物种全基因组水平的miRNA图谱，实现包括新miRNA分子的挖掘，其作用靶基因的预测和鉴定、样品间差异表达分析、miRNAs聚类和表达谱分析等科学应用。什么是miRNA测序成熟的microRNA（miRNA）是17~24nt的单链非编码RNA分子，通过与mRNA相互作用影响目标mRNA的稳定性及翻译，最终诱导基因沉默，调控着基因表达、细胞生长、发育等生物学过程。基于第二代测序技术的microRNA测序，可以一次性获得数百万条microRNA序列，能够快速鉴定出不同组织、不同发育阶段、不同疾病状态下已知和未知的microRNA及其表达差异，为研究microRNA对细胞进程的作用及其生物学影响提供了有力工具。什么是 Chip-seq 染色质免疫共沉淀技术（ChromatinImmunoprecipitation，ChIP）也称结合位点分析法，是研究体内蛋白质与DNA相互作用的有力工具，通常用于转录因子结合位点或组蛋白特异性修饰位点的研究。将ChIP与第二代测序技术相结合的ChIP-Seq技术，能够高效地在全基因组范围内检测与组蛋白、转录因子等互作的DNA区段。 C hIP-Seq 的原理是：首先通过染色质免疫共沉淀技术（ChIP）特异性地富集目的蛋白结合的DNA片段，并对其进行纯化与文库构建；然后对富集得到的DNA片段进行高通量测序。研究人员通过将获得的数百万条序列标签精确定位到基因组上，从而获得全基因组范围内与组蛋白、转录因子等互作的DNA区段信息。什么是 CHIRP-Seq C HIRP-Seq( Chromatin Isolation by RNA Purification ) 是一种检测与RNA绑定的DNA和蛋白的高通量测序方法。方法是通过设计生物素或链霉亲和素探针，把目标RNA拉下来以后，与其共同作用的DNA染色体片段就会附在到磁珠上，最后把染色体片段做高通量测序，这样会得到该RNA能够结合到在基因组的哪些区域，但由于蛋白测序技术不够成熟，无法知道与该RNA结合的蛋白。什么是 RIP-seq RNA Immunoprecipitation 是研究细胞内RNA与蛋白结合情况的技术，是了解转录后调控网络动态过程的有力工具，能帮助我们发现miRNA的调节靶点。这种技术运用针对目标蛋白的抗体把相应的RNA-蛋白复合物沉淀下来，然后经过分离纯化就可以对结合在复合物上的RNA进行测序分析。 RIP 可以看成是普遍使用的染色质免疫沉淀ChIP技术的类似应用，但由于研究对象是RNA-蛋白复合物而不是DNA-蛋白复合物，RIP实验的优化条件与ChIP实验不太相同（如复合物不需要固定，RIP反应体系中的试剂和抗体绝对不能含有RNA酶，抗体需经RIP实验验证等等）。RIP技术下游结合microarray技术被称为RIP-Chip ，帮助我们更高通量地了解癌症以及其它疾病整体水平的RNA变化。什么是 CLIP-seq C LIP-seq, 又称为HITS-CLIP，即紫外交联免疫沉淀结合高通量测序(crosslinking-immunprecipitationand high-throughput sequencing), 是一项在全基因组水平揭示RNA分子与RNA结合蛋白相互作用的革命性技术。其主要原理是基于RNA分子与RNA结合蛋白在紫外照射下发生耦联，以RNA结合蛋白的特异性抗体将RNA-蛋白质复合体沉淀之后，回收其中的RNA片段，经添加接头、RT-PCR等步骤，对这些分子进行高通量测序，再经生物信息学的分析和处理、总结，挖掘出其特定规律，从而深入揭示RNA结合蛋白与RNA分子的调控作用及其对生命的意义。什么是 metagenomic （宏基因组）： Magenomics 研究的对象是整个微生物群落。相对于传统单个细菌研究来说，它具有众多优势，其中很重要的两点：(1) 微生物通常是以群落方式共生于某一小生境中，它们的很多特性是基于整个群落环境及个体间的相互影响的，因此做Metagenomics研究比做单个个体的研究更能发现其特性；(2)Metagenomics研究无需分离单个细菌，可以研究那些不能被实验室分离培养的微生物。宏基因组是基因组学一个新兴的科学研究方向。宏基因组学（又称元基因组学，环境基因组学，生态基因组学等），是研究直接从环境样本中提取的基因组遗传物质的学科。传统的微生物研究依赖于实验室培养，宏基因组的兴起填补了无法在传统实验室中培养的微生物研究的空白。过去几年中，DNA测序技术的进步以及测序通量和分析方法的改进使得人们得以一窥这一未知的基因组科学领域。什么是 SNP 、 SNV （单核苷酸位点变异）单核苷酸多态性singlenucleotide polymorphism，SNP 或单核苷酸位点变异SNV。个体间基因组DNA序列同一位置单个核苷酸变异(替代、插入或缺失)所引起的多态性。不同物种、个体基因组DNA序列同一位置上的单个核苷酸存在差别的现象。有这种差别的基因座、DNA序列等可作为基因组作图的标志。人基因组上平均约每1000个核苷酸即可能出现1个单核苷酸多态性的变化，其中有些单核苷酸多态性可能与疾病有关，但可能大多数与疾病无关。单核苷酸多态性是研究人类家族和动植物品系遗传变异的重要依据。在研究癌症基因组变异时，相对于正常组织，癌症中特异的单核苷酸变异是一种体细胞突变（somatic mutation），称做SNV。什么是 INDEL ( 基因组小片段插入）基因组上小片段（50bp）的插入或缺失，形同SNP/SNV。什么是 copy number variation （ CNV ）：基因组拷贝数变异基因组拷贝数变异是基因组变异的一种形式，通常使基因组中大片段的DNA形成非正常的拷贝数量。例如人类正常染色体拷贝数是2，有些染色体区域拷贝数变成1或3，这样，该区域发生拷贝数缺失或增加，位于该区域内的基因表达量也会受到影响。如果把一条染色体分成A-B-C-D四个区域，则A-B-C-C-D/A-C-B-C-D/A-C-C-B-C-D/A-B-D分别发生了C区域的扩增及缺失，扩增的位置可以是连续扩增如A-B-C-C-D也可以是在其他位置的扩增，如A-C-B-C-D。什么是 structure variation （ SV ）：基因组结构变异染色体结构变异是指在染色体上发生了大片段的变异。主要包括染色体大片段的插入和缺失（引起CNV的变化），染色体内部的某块区域发生翻转颠换，两条染色体之间发生重组（inter-chromosometrans-location）等。一般SV的展示利用Circos软件。什么是Segment duplication 一般称为SD区域，串联重复是由序列相近的一些DNA片段串联组成。串联重复在人类基因多样性的灵长类基因中发挥重要作用。在人类染色体Y和22号染色体上，有很大的SD序列。什么是 genotype andphenotype 既基因型与表型；一般指某些单核苷酸位点变异与表现形式间的关系。什么是 Read? 高通量测序平台产生的序列标签就称为reads。什么是 soft-clipped reads 当基因组发生某一段的缺失，或转录组的剪接，在测序过程中，横跨缺失位点及剪接位点的reads回帖到基因组时，一条reads被切成两段，匹配到不同的区域，这样的reads叫做soft-clipped reads，这些reads对于鉴定染色体结构变异及外源序列整合具有重要作用。什么是 multi-hits reads 由于大部分测序得到的reads较短，一个reads能够匹配到基因组多个位置，无法区分其真实来源的位置。一些工具根据统计模型，如将这类reads分配给reads较多的区域。什么是 Contig? 拼接软件基于reads之间的overlap区，拼接获得的序列称为Contig（重叠群）。什么是 Scaffold? 基因组de novo测序，通过reads拼接获得Contigs后，往往还需要构建454 Paired-end库或Illumina Mate-pair库，以获得一定大小片段（如3Kb、6Kb、10Kb、20Kb）两端的序列。基于这些序列，可以确定一些Contig之间的顺序关系，这些先后顺序已知的Contigs组成Scaffold。什么是 Contig N50 ？ Reads 拼接后会获得一些不同长度的Contigs。将所有的Contig长度相加，能获得一个Contig总长度。然后将所有的Contigs按照从长到短进行排序，如获得Contig 1，Contig 2，Contig 3...………Contig 25。将Contig按照这个顺序依次相加，当相加的长度达到Contig总长度的一半时，最后一个加上的Contig长度即为Contig N50。举例：Contig 1+Contig 2+ Contig 3+Contig4=Contig总长度*1/2时，Contig 4的长度即为Contig N50。 Contig N50可以作为基因组拼接的结果好坏的一个判断标准。什么是 Scaffold N50 ？ ScaffoldN50 与ContigN50的定义类似。 Contigs拼接组装获得一些不同长度的Scaffolds。将所有的Scaffold长度相加，能获得一个Scaffold总长度。然后将所有的Scaffolds按照从长到短进行排序，如获得Scaffold 1，Scaffold 2，Scaffold 3...………Scaffold 25。将Scaffold按照这个顺序依次相加，当相加的长度达到Scaffold总长度的一半时，最后一个加上的Scaffold长度即为Scaffold N50。举例：Scaffold 1+Scaffold 2+Scaffold 3 +Scaffold 4 +Scaffold 5=Scaffold总长度*1/2时，Scaffold 5的长度即为Scaffold N50。 Scaffold N50可以作为基因组拼接的结果好坏的一个判断标准。什么是测序深度和覆盖度？测序深度是指测序得到的总碱基数与待测基因组大小的比值。假设一个基因大小为2M，测序深度为10X，那么获得的总数据量为20M。覆盖度是指测序获得的序列占整个基因组的比例。由于基因组中的高GC、重复序列等复杂结构的存在，测序最终拼接组装获得的序列往往无法覆盖有所的区域，这部分没有获得的区域就称为Gap。例如一个细菌基因组测序，覆盖度是98%，那么还有2%的序列区域是没有通过测序获得的。什么是RPKM、FPKM RPKM,ReadsPer Kilobase of exon model per Million mapped reads, is defined in this way : 每1百万个map上的reads中map到外显子的每1K个碱基上的reads个数。假如有1百万个reads映射到了人的基因组上，那么具体到每个外显子呢，有多少映射上了呢，而外显子的长度不一，那么每1K个碱基上又有多少reads映射上了呢，这大概就是这个RPKM的直观解释。下载附件 (12.31 KB) 如果对应特定基因的话，那么就是每1000000 mapped到该基因上的reads中每kb有多少是mapped到该基因上的exon的read Totalexon reads:This is the number in the column with header Total exonreads in therow for the gene. This is the number of reads that have beenmapped to a regionin which an exon is annotated for the gene or across theboundaries of two exonsor an intron and an exon for an annotated transcript ofthe gene. Foreukaryotes, exons and their internal relationships are defined byannotations oftype mRNA. 映射到外显子上总的reads个数。这个是映射到某个区域上的reads个数，这个区域或者是已知注释的基因或者跨两个外显子的边界或者是某个基因已经注释的转录本的内含子、外显子。对于真核生物来说，外显子和它们自己内部的关系由某类型的mRNA来注释。 Exonlength: This is the number in the column with the header Exon length inthe rowfor the gene, divided by 1000. This is calculated as the sum of thelengths ofall exons annotated for the gene. Each exon is included only once inthis sum,even if it is present in more annotated transcripts for the gene.Partlyoverlapping exons will count with their full length, even though theyshare thesame region. 外显子的长度。计算时，计算所有某个基因已注释的所有外显子长度的总和。即使某个基因以多种注释的转录本呈现，这个外显子在求和时只被包含一次。即使部分重叠的外显子共享相同的区域，重叠的外显子以其总长来计算。 Mapped reads: The sum of all the numbers in the column with header Totalgenereads. The Total gene reads for a gene is the total number ofreads that aftermapping have been mapped to the region of the gene. Thus thisincludes all thereads uniquely mapped to the region of the gene as well asthose of the readswhich match in more places (below the limit set in thedialog in figure 18.110 ) that have been allocated tothis gene's region. Agene's region is that comprised of the flanking regions(if it was specified infigure 18.110 ), the exons, the introns andacross exon-exonboundaries of all transcripts annotated for the gene. Thus,the sum of the totalgene reads numbers is the number of mapped reads for thesample (you can findthe number in the RNA-Seq report).map 的reads总和。映射到某个基因上的所有reads总数。因此这包含所有的唯一映射到这个区域上的reads。举例：比如对应到该基因的read有1000个，总reads个数有100万，而该基因的外显子总长为5kb，那么它的RPKM为：10^9*1000(reads个数)/10^6(总reads个数)*5000(外显子长度)=200或者：1000(reads个数)/1(百万)*5(K)=200 这个值反映基因的表达水平。 FPKM(fragmentsper kilobase of exon per million fragments mapped). FPKM 与RPKM计算方法基本一致。不同点就是 FPKM计算的是fragments，而RPKM计算的是reads。Fragment比read的含义更广，因此FPKM包含的意义也更广，可以是pair-end的一个fragment，也可以是一个read。什么是转录本重构用测序的数据组装成转录本。有两种组装方式：1，de-novo构建； 2，有参考基因组重构。其中de-novo组装是指在不依赖参考基因组的情况下，将有overlap的reads连接成一个更长的序列，经过不断的延伸，拼成一个个的contig及scaffold。常用工具包括velvet，trans-ABYSS，Trinity等。有参考基因组重构，是指先将read贴回到基因组上，然后在基因组通过reads覆盖度，junction位点的信息等得到转录本，常用工具包括scripture、cufflinks。什么是genefusion 将基因组位置不同的两个基因中的一部分或全部整合到一起，形成新的基因，称作融合基因，或嵌合体基因。该基因有可能翻译出融合或嵌合体蛋白。什么是表达谱基因表达谱(geneexpression profile)：指通过构建处于某一特定状态下的细胞或组织的非偏性cDNA文库,大规模cDNA测序,收集cDNA序列片段、定性、定量分析其mRNA群体组成,从而描绘该特定细胞或组织在特定状态下的基因表达种类和丰度信息,这样编制成的数据表就称为基因表达谱什么是功能基因组学功能基因组学（Functuionalgenomics）又往往被称为后基因组学（Postgenomics），它利用结构基因组所提供的信息和产物，发展和应用新的实验手段，通过在基因组或系统水平上全面分析基因的功能，使得生物学研究从对单一基因或蛋白质得研究转向多个基因或蛋白质同时进行系统的研究。这是在基因组静态的碱基序列弄清楚之后转入对基因组动态的生物学功能学研究。研究内容包括基因功能发现、基因表达分析及突变检测。基因的功能包括：生物学功能，如作为蛋白质激酶对特异蛋白质进行磷酸化修饰；细胞学功能，如参与细胞间和细胞内信号传递途径；发育上功能，如参与形态建成等。采用的手段包括经典的减法杂交，差示筛选，cDNA代表差异分析以及mRNA差异显示等，但这些技术不能对基因进行全面系统的分析，新的技术应运而生，包括基因表达的系统分析（serial analysis of gene expression,SAGE），cDNA微阵列（cDNA microarray），DNA 芯片（DNA chip）和序列标志片段显示（sequence taggedfragmentsdisplay。什么是比较基因组学比较基因组学(ComparativeGenomics)是基于基因组图谱和测序基础上，对已知的基因和基因组结构进行比较，来了解基因的功能、表达机理和物种进化的学科。利用模式生物基因组与人类基因组之间编码顺序上和结构上的同源性，克隆人类疾病基因，揭示基因功能和疾病分子机制，阐明物种进化关系，及基因组的内在结构。什么是表观遗传学表观遗传学是研究基因的核苷酸序列不发生改变的情况下，基因表达了可遗传的变化的一门遗传学分支学科。表观遗传的现象很多，已知的有DNA甲基化（DNAmethylation），基因组印记（genomicimpriting），母体效应（maternaleffects），基因沉默（genesilencing），核仁显性，休眠转座子激活和RNA编辑（RNA editing）等。什么是计算生物学计算生物学是指开发和应用数据分析及理论的方法、数学建模、计算机仿真技术等。当前，生物学数据量和复杂性不断增长，每14个月基因研究产生的数据就会翻一番，单单依靠观察和实验已难以应付。因此，必须依靠大规模计算模拟技术，从海量信息中提取最有用的数据。什么是基因组印记基因组印记(又称遗传印记)是指基因根据亲代的不同而有不同的表达。印记基因的存在能导致细胞中两个等位基因的一个表达而另一个不表达。基因组印记是一正常过程，此现象在一些低等动物和植物中已发现多年。印记的基因只占人类基因组中的少数，可能不超过5%，但在胎儿的生长和行为发育中起着至关重要的作用。基因组印记病主要表现为过度生长、生长迟缓、智力障碍、行为异常。目前在肿瘤的研究中认为印记缺失是引起肿瘤最常见的遗传学因素之一。什么是基因组学基因组学（英文genomics），研究生物基因组和如何利用基因的一门学问。用于概括涉及基因作图、测序和整个基因组功能分析的遗传学分支。该学科提供基因组信息以及相关数据系统利用，试图解决生物，医学，和工业领域的重大问题。什么是DNA甲基化 DNA 甲基化是指在DNA甲基化转移酶的作用下，在基因组CpG二核苷酸的胞嘧啶5'碳位共价键结合一个甲基基团。正常情况下，人类基因组“垃圾”序列的CpG二核苷酸相对稀少，并且总是处于甲基化状态，与之相反，人类基因组中大小为100—1000 bp左右且富含CpG二核苷酸的CpG岛则总是处于未甲基化状态，并且与56％的人类基因组编码基因相关。人类基因组序列草图分析结果表明，人类基因组CpG岛约为28890个，大部分染色体每1 Mb就有5—15个CpG岛，平均值为每Mb含10．5个CpG岛，CpG岛的数目与基因密度有良好的对应关系。由于DNA甲基化与人类发育和肿瘤疾病的密切关系，特别是CpG岛甲基化所致抑癌基因转录失活问题，DNA甲基化已经成为表观遗传学和表观基因组学的重要研究内容。什么是基因组注释基因组注释(Genomeannotation) 是利用生物信息学方法和工具,对基因组所有基因的生物学功能进行高通量注释 , 是当前功能基因组学研究的一个热点。基因组注释的研究内容包括基因识别和基因功能注释两个方面。基因识别的核心是确定全基因组序列中所有基因的确切位置。

个人分类: 科研方面|10523 次阅读|0 个评论

你想测自己基因组序列吗

热度 6 xudabin98 2013-6-11 01:08

1984 年12月美国犹他大学的雷蒙.怀特受能源部委托组织召开了一个小型学术会议，该会议围绕检测病人突变基因的方法进行了讨论。会议结束后得出的结论是：要想有效的检测出病人突变的基因，最好的方法是绘制出人类基因组序列作为参考。1985年5月美国能源部提出了测定人类基因组全部序列的草案。1986年3月，诺贝尔奖获得者达尔贝克在Science上撰文《癌症研究的转折点—人类基因组全序列分析》，在该篇文章中首次提出了“人类基因组计划”这一概念。此后，经过美国能源部、科学院、国会和国立卫生研究院组成的专家组反复论证五年之久，1990年10月1日，美国国会正式批准启动人类基因组计划，投资达30亿美元，利用15年时间，于2005年构建完成详细的人类基因组遗传图和物理图。由于测序技术的进步和美国赛莱拉公司的强势竞争，2000年6月26日发布人类基因组序列框架图，2001年2月更详细的序列图发布。该计划在提出时也讨论了其长远意义，比如在基础科学上，通过对人类所携带全部遗传信息解读，从分子层面上揭示人体生长发育和各种生命活动的机制，以及衰老死亡和疾病发生的分子机理。在医学应用上，则通过检测个人的遗传信息，确定自己可能会发生的疾病，从而在尽可能的情况下预防疾病的发生。例如，当一个妇女通过基因测序发现自己携带BRCAI突变基因，那么意味着该妇女在患乳腺癌或者卵巢癌的可能性上增大，当然检测到携带突变基因并不意味着就一定会发病，同时还受环境因素等的影响。这时，该妇女可选择是否通过切除双乳腺来预防癌症的发生。最近美国影星茱莉乳腺切除就是对这一意义最好的诠释。该计划的实施也推动了测序技术的飞速发展，目前个人基因组测序服务周转时间已低至2周。生物学家曾经描绘的美妙蓝图：“每个人都将拥有自己的基因组序列，并且可以将这些信息装在一个U盘中”，如今想要成为事实已不是什么难事。全球知名测序仪器制造公司Illumina，其总裁兼CEO Jay Flatley曾表示：“Illumina一直相信测序将成为临床上的主流做法。全基因组测序在诊断和治疗疾病上的潜力正迅速获得认可，特别是对于那些光凭症状无法判定的疾病。此时，快速的全基因组测序能提供遗传组成的整体信息，让医生能做出更明智的决定，病人也能更快得到答案。”同时国内很多高通量测序公司也在极力鼓吹个人基因组测序在个性化医疗上的作用，而我们一旦生病进入医院，又常常听从医生的指挥，各种检测与治疗都由他们制定，但其中很多问题却不能忽略，也不应该忽略。随着技术的飞速发展，传统的道德伦理在当今的社会生活中出现了前所未有的困惑局面，比如人的克隆、胚胎干细胞。高通量测序技术的日益成熟，使得测序价格一降再降，是否就应该直接应用在医疗产业上来辅助治疗，其意义有多大？是否违背伦理？比如亨廷顿舞蹈病，通过基因组测序获知其突变信息，结果是不容质疑的，然而对于疾病的解决目前来看是毫无意义的。而对于尚未发病的人，检测结果被病人获知后是否会患上抑郁乃至自杀？这样的检测结果意义何在？又比如产前无创检测，当我们得知胎儿出生后可能会出现某种缺陷，选择流产对于一个家庭以后的负担与幸福生活具有积极的一面，然而我们是否又有权利将将还未见到一丝光明的婴儿杀死于腹中？当个人遗传信息泄露后，是否会遭受社会歧视，影响个人的婚恋、学习、交友？在更多的伦理问题尚未形成一个标准前，以技术发展乃至金钱驱动为目的的个人信息测序应当让当事人有足够的知情权。对待生命伦理问题上，国际社会出台了一系列相关法律文件，比如纽伦堡法典、贝尔蒙报告、世界医学协会赫尔辛基宣言等等。在赫尔辛基宣言中就明确写道：医学研究中，医生的职责就是保护人类受试者的生命、健康、隐私和尊严。涉及人的生物医学研究必须遵循普遍接受的原则，必须以对科学文献及其他有关信息的全面了解为基础，以充分的实验室和动物实验为基础。纽伦堡法典也明确提出：受试者的自愿同意绝对必要。在对待个人基因组序列测定上，不能也不应该只打着临床监测需要或者其他目的而滥加利用与宣传。因此，当个人想要获得自己遗传信息时，一定要有足够的知情权并在目前的情况下承担相应的风险，而不仅仅是听从各方面的鼓吹。

11572 次阅读|24 个评论

给人的免疫系统拍张快照

热度 4 jiankuihe 2013-2-18 22:30

原文作者： Francis Collins (NIH Director). 02/03/2013 （注：我上周在美国 Science 杂志的子刊 Science Translational Medicine 上发表了一篇论文“ Lineage structure of the human antibody repertoire in response to influenza vaccination ”， Francis Collins 看了之后非常赞赏，特地在他的博客上写了一篇文章了介绍我们的工作，我把它翻译成中文 ----- 贺建奎） Source: National Cancer Institute Visuals Online , NIH 现在临床上有许多种检测可以监控你的健康状况，但是却没有一种被广泛接受的方法可以检测你免疫系统的各个方面。我们怎么可以得知一个人的免疫系统是很强健还是很虚弱？在人们受哮喘，过敏，关节炎折磨时，如何量化免疫系统的错误？斯坦福大学的一个研究团队在开发这样的检测方面迈出了第一步，他们的方法是：给免疫系统“拍照”。在讨论他们所做的工作之前，我们先来回顾一下人体的免疫系统是如何保护我们免受疾病困扰的。先天性免疫系统就像是常规部队一样，它攻击入侵的微生物，保护着我们的健康。但是这只常规部队没有记忆，当入侵者再次返回时它们并不能很快的识别出来。这时候，适应性免疫系统出场了。适应性免疫系统由 B 细胞和 T 细胞组成。这些细胞不仅可以记住入侵者，而且还可以调整它们的“武器”，即抗体和 T 细胞受体，使得它们的反应更加有效。我们可以称之为特种部队。当疫苗，比如说，流感疫苗，注射入人体后，它扮演了一个类似军事演习中的敌方入侵者，来训练我们的免疫系统。我的特种部队因此而吹响号角，拿起武器来提前准备抵抗真正的入侵者。当真正的入侵者随后到来时，你的身体已经布置好已经制备精良的抗体，大部分的时候，在入侵者让你得病之前就把它们消灭了。但当我们衰老时，我们得流感的风险在不断增加。为什么呢？一个对我们的抗体的全面检查可能提供答案的线索，这就是我今天介绍斯坦福大学研究团队的原因。在美国国立卫生研究院的资助下，这些研究人员招募了 17 个志愿者，年龄分布在 8 岁到 100 岁之间。每个志愿者都接受了季节性流感疫苗的接种，并且抽了三次血样，其中一次在打疫苗之前，两次在打疫苗之后。使用高通量测序技术，这个团队研究了每个志愿者在每个时间点的每一个抗体 --- 共有 500 万个抗体！他们调查了出现的抗体的类型（共有 5 种类型）和每一种类型的抗体的数目。然后，他们比较了这些人身上同样类型的每一个抗体。所有这些信息归总起来可以让我们知道任何两个抗体是不是从一个族系出来的 -- 就像是家谱一样。当研究人员仔细计算这些数字时，他们发现 70-100 岁之间的老人的抗体的多样性远低于年轻人。也就是说，当人变老的时候，免疫系统的抗体库（武器库）就变得非常有限了。是不是这种情况会影响老人对接种流感疫苗的效果？是不是这样会减弱他们对抗感染的能力？答案是很有可能。也许，这个变少了，不那么多样化的抗体库正好解释了为什么流感疫苗在老年人身上有时候会没那么有效果。我们还需要进一步的研究来证实。给免疫系统拍快照有助于我们找到答案。这种抗体的快照是最近几年才成为可能，主要是因为基因组学的进步。这技术可以用来诊断自身免疫性疾病 --- 尤其是当这个疾病中有抗体的“指纹”。它同样也提供了一个强有力的工具来监测一个人的治疗过程是否有效，以及为流感和其他症状提供一个个性化的风险预估：这正是个性化医疗的一面。虽然这项激动人心的研究还在继续进行，但接种季节性流感疫苗仍不失为一个明智之举。 References: Lineage structure of the human antibody repertoire in response to influenza vaccination. Jiang N, He J, Weinstein JA, Penland L, Sasaki S, He XS, Dekker CL, Zheng NY, Huang M, Sullivan M, Wilson PC, Greenberg HB, Davis MM, Fisher DS, Quake SR. Sci Transl Med. 2013 Feb 6;5(171):171 原文链接： http://directorsblog.nih.gov/taking-a-snapshot-of-the-human-immune-system/

8237 次阅读|4 个评论

健康，是不生病？还是生了病就自愈？

热度 6 SNPs 2012-4-14 00:16

我们总是把健康和疾病放在一起看，健康就是不生病，生病就是不健康。其实，把这两个概念分开分析可能很有必要。健康是一种经常的身体状态，健康人也生病，但是得了病很快就好。把一个有先天免疫缺陷的病人放在一个完全隔离的环境下，他也可以保持不生病，可是我们不能说他就是健康的。所以说，健康人应该有比较完善的免疫系统，能够对付任何内忧外患，外御感染，内防突变。生病可以是好事，小病不断，大病不犯。免疫系统就需要经常性的练兵。保持健康，就需要保持一个平衡的，有潜力的，能随机应变的，多样化的免疫系统。而相反，病态，就是免疫系统失去了应有的平衡和多样性。如何诊断健康？如何识别疾病？是否也能从观测免疫系统的“备战”情形得到相关信息？这，就是我们做免疫组库高通量测序的目的。免疫系统对体内的任何病症都是最先知道，而且特异性非常强，所以能“读懂”免疫系统的完整信息，就能更快更准地诊断疾病了。

个人分类: 免疫组库新领域|5849 次阅读|7 个评论

下下代测序技术：面条PK米饭

热度 2 SNPs 2012-2-19 03:10

这几天行业新闻就是新出场的“下下代”测序技术，Oxford Nanopore。在佛罗里达开的测序会AGBT上发布这个消息以后，几个相关的“下一代”测序公司的股价都受到影响而下滑：股价不一定就是晴雨表，这个技术到底有多大用途？什么时候能够产业化？这些都还是问题。我还没有来得及深入研究这个技术，以前听过相关的演讲。知道这个技术的特点是不需要扩增，也就没有相关的复制误差。技术原理有点象在吃面条，抓住一头一吸，从头读到尾；而现有的高通量技术则有点像吃米饭，一粒粒的很短，需要读很“深”才能避免出错。如果是那样，可能这个技术的好处是分析几个细胞的基因组，有点象抽蚕丝一样，把一根DAN分子通读一下，得到比较完整的全基因组序列。所以他们拼的不是通量，而是长度和精确度。同时，他们的好处是对标本要求比较低，价格低，速度快，体积小。不过他们也不是万能的。比如我们免疫组库的测序就还是需要象Illumina HiSeq那样的高通量技术平台。因为我们需要测序的是标本中几十万个不同的T细胞或B细胞受体，而且每个分子都是“从新测序”（de novo sequencing), 不是重复测序。所以，不是每个全新的技术平台都能完美地替代前一代的产品。就如Ion Torrent不能取代454和HiSeq一样。有的客人喜欢吃米饭，有的就喜欢面食，生物技术也是如此。不能盲目崇拜某个平台，要学会冷静，清醒地分析不同平台的优缺点，找到自己介入和发挥的机会。在这个AGBT会议上，我们也有两个演讲（我没有参加，合作者发表）：一个讲R10K项目；另一个讲用Ion Torrent做免疫组库测序。两个演讲都得到很好的反映，又多了几个申请R10K合作的科学家。

个人分类: 生物技术创新创业|6167 次阅读|3 个评论

中草药基因组漫想

热度 2 bingansuan 2011-9-14 23:52

中草药在中国已经探索研究使用了几千年，此外，日本，韩国，甚至一些美洲的土著也有使用中草药的相关记载，一味地抨击中草药的药用价值无效，无异于相信地球是太阳系的中心一样不可理喻。此外，除了医疗治病以外，中草药在化妆品、日用品等领域也有广泛应用，云南白药，田七牙膏，六神花露水、相宜本草等等，在大超市随处可见。正因为如此，一些公司在中草药开发中投入了巨额资金进行研发。虽然对中草药的需求是逐日剧增，但中草药目前驯化的品种较少，大部分都是野生的，如何将野生驯化成家养品种，并且符合人们的需求是一件迫切的事情。因为如果不能解决驯化问题，很多野生中草药资源将很快枯竭，一方面，生物多态性得不到保护，另一方面，地球上也丢失了这个物种珍贵的基因资源和潜在进一步开发利用的可能性。对于中草药来讲，目前一般从两方面着手解决问题。一、从中草药药用成分入手，弄清楚哪些成分是起作用的，比如青蒿素之于青蒿。二、从分子研究入手，弄清楚中草药物种的基因组序列，及整个代谢通路等。从已有资料看，整个中草药分子研究基础比较薄弱，主要有以下内容：1 通过SSR等分子标记，研究群体进化关系、遗传多样性，鉴定地道品种、构建遗传图谱等；2 通过EST测序或者转录组测序（表达谱测序），寄希望于研究相关代谢通路。但是目前为止，除了青蒿通过高通量测序+基因分型芯片构建了遗传图谱，并进行了目标性状QTL定位，这一工作较为出色外，未见其他有太大亮点的关于中草药的文献报道（也许有，可能我没关注到而已）。这些中草药分子领域的研究，一步步开拓着人们的视野，最终势必会把研究人员带到基因组面前，一个物种几乎所有的遗传信息都隐藏于其基因组序列之中。基因组序列的破译势必会为后面的-诸如分子育种、表观遗传，代谢通路分析奠定坚实基础，从而推动整个物种的系统研究。期待第一篇中草药基因组序列的文献报道。

个人分类: 中草药|6486 次阅读|9 个评论

[转载]高通量测序技术的发展趋势

nooney1986 2011-9-9 16:37

在本期的《Genetic Engineering Biotechnology News》杂志上，Harry Glorikian 和Brian Clancy盘点了他们认为值得关注的测序趋势，包括测序活动的两极化、流程价值的转变，以及临床和商业应用。首先，他们谈到了测序活动的两极化，即最大和最小实验室所开展的高通量测序活动的份额正在逐步增加，这是由一系列同时存在的集中和分散力量驱动的。最重要的集中力量是研究协作组的出现，他们试图对大量人及其他物种的基因组进行测序和分析，目标是发现新的变异体，并探索它们对于人类健康的意义。他们认为，出现这种趋势的原因是分析大量基因组的经济性。随着样品的增多，样品制备、测序本身以及后续分析的成本有下降的趋势。而作者认为，分散测序行为的力量则更多更复杂。讨论最多的力量是台式高通量测序仪的出现（即近日报道的个人型测序仪），它们的价格与高端仪器要低得多。这种新兴仪器的扩展性好，且有着更快的周转时间，因此有望在某些应用中取代毛细管电泳技术。 Glorikian和Clancy认为，第二个重大趋势是流程的价值转变，即高通量测序流程中使用了更多除测序仪和消耗品之外的去商品化（decommoditization）和商品化资源。这种趋势的主要推动力是技术本身，并与第二代测序技术的成熟和更新一代测序仪的出现有关。作者谈到，大型基因组中心在2005年大约花费65%在工具（仪器和消耗品）上，但到了2010年，工具花费则降低至~40-50%。预计今后还会继续降低，因为计算机设施和样品物流设施的投资增加，而且还需要雇佣更多的人员，如生物信息学家和病理学家。作者认为未来几年的增长点将是样品制备仪器及消耗品，DNA剪切和大小选择仪器及消耗品，亚硫酸氢盐测序试剂盒、染色质免疫沉淀试剂盒、序列富集仪器及消耗品，以及生物信息学工具。最后，也是生命科学界最感兴趣的一个趋势，是测序技术扩散到临床和商业应用中。这个趋势主要是由两种力量推动的，即不断增长的高性能需求和快速扩展的技术性能范围。尽管大部分的测序讨论集中在技术的性能改善上，但作者认为，客户需求的变化更为重要，也非常快。从分析的角度来看，愿望是降低假阳性和假阴性，而从临床的角度来看，则是提高阳性和阴性预测值。他们将测序中最长期和最重要的趋势称为测序技术的无所不能。高通量测序技术将逐步扩散到基因组学之外，进入其他分析物的分析，包括小分子、蛋白和肽段，以及科研、临床和商业应用中的细胞现象。作者总结道，考虑到整个分析仪器市场的规模（大约400亿美元）以及商业化体外诊断市场的规模（约410亿美元），现有市场参与者和客户的影响将是可观的。如果几台测序仪能够取代整个临床实验室，那么行业巨头最终有可能处境危险。

个人分类: 分子诊断|1281 次阅读|0 个评论

人类基因组工程给美国赚了多少钱？

热度 36 SNPs 2011-8-19 09:58

当今世界，在科学上的竞争也就是在商场上的竞争，创新带来的是巨大的经济效益有时比一场战争带来的都多很多。不久前，美国著名的 Battelle研究院公布了一个研究报告（点下图下载全文），分析了人类基因组工程的投资回报率：如报告的封面上提要讲的：美国政府在人类基因组工程上的投入是三十八亿美金，可是带动的是今天七千九百六十亿的经济影响，给美国创造了三十一万个新的就业机会，而且效益还刚刚开始。 Battelle 研究院的报告指出：在人类基因组工程项目上，美国政府的投资回报率是1:141! 投资一块美金，已经赚回了$141美金，而且好戏还在后面，有更多的分支项目，更多的赚钱机会。下面是一些正在进行着的大规模测序项目，绝大多数都是美国启动的：我们HudsonAlpha研究院刚刚起步的 R10K (repertoire 10K) 项目也是类似的大规模测序项目。当今的中国，拿出这区区三十八亿美金完全没有问题。抓1.5个贪官就够了。可是，还有象人类基因组工程这样的机会吗？如果有，我们能抓住吗？我以前写过一篇博客问 “基因组这样的‘大科学’能在中国启动吗？” ，答案很不乐观。从前些天有关“两弹一星”是否是创新的讨论中我们就不难看出，我们对“创新”的概念还不是十分清楚。我们把毛主席说的：“我们也要搞人造卫星”当成了“创新”的原始动力，把“突破敌人的封锁”当成了创新的优异成绩，把“赶超世界先进水平”当成了目的。这些都是必须的，急需的，没错。可是真正的创新还是需要做出象人类基因组工程这样的绝对领先的项目来。不然，华大买的上百台Illumina高通量测序仪就成了美国“投资回报率”中的回报。什么时候，我们的院士们能坐在一起开个会，折腾出个“人类基因组工程”这样的大军团联合作战式的项目，不是去“赶超世界先进水平”而是“让世界来赶超我们”，那就好了。

个人分类: 生物技术创新创业|16256 次阅读|43 个评论

国际组织对能适应极端条件的拟南芥基因组进行测序

bioyong 2011-8-17 10:55

International Group Sequences Genome of Arabidopsis Relative Adapted to Extreme Conditions 2011 年 8 月 8 日， NEW YORK (GenomeWeb News) ， Andrea Anderson 报道 – 研究人员昨天在 Nature Genetics 在线报道他们对一种叫条叶蓝芥（ Thellugiella parvula ）的植物进行了基因组测序。这种植物与模式植物拟南芥亲缘关系很近，但更耐极端条件。伊利诺伊大学厄巴纳 - 香槟分校 Han Bohnert 植物生化实验室博士后 Dong-Ha Oh 告诉 GenomeWeb Daily News ，通常情况下，这种植物具有耐盐、抗热，抗寒的特性。他说“拟南芥已经被很好的研究，但是它不具有任何抗性。来自美国，韩国和沙特阿拉伯的 Oh 和他的同事们用高通量测序完成了条叶蓝芥（ Thellugiella parvula ）基因组草图，通过比较条叶蓝芥与拟南芥的基因组和转录组序列，他们发现了有关条叶蓝芥可以在极端条件下生存的遗传机制的线索。其中包括：涉及到的应激反应和其它基因的加倍。研究人员用 454 的 GS FLX Titanium 和 Illumina GAII 测序平台对生长在土耳其中心的盐湖的一株条叶蓝芥 DNA 进行测序，测序深度达到 50 倍，条叶蓝芥的基因组大小约为 1.4 亿个碱基。条叶蓝芥与拟南芥大约在 43 万年前发生分离，尽管他们之间的亲缘关系很近，但这两种植物耐受盐和其他胁迫的能力完全不同。研究人员写到：“条叶蓝芥基因组的公布提供了研究染色体结构，组织，基因补充的独到视角，特别重要的是条叶蓝芥的基因组与拟南芥的基因组相对较，无疑这种植物是压力敏感的物种。利用两种平台互补的方法 ---- 用罗氏 454 reads 作为序列的骨架，用测序深覆盖度的 illumina reads 补 gaps ，并且相互校正 reads 的准确率 --- 组装出将近 1500 个 meta-contigs ，每个 meta-contig 的长度在 1000bp-1300 万 bp 之间。 Oh 说“许多大 contigs 与染色体臂的大小相当，因此，我们能够利用新一代测序工具组装染色体”。当研究人员分析条叶蓝芥草图基因组时，他们预测大约 28901 个编码蛋白序列，拟南芥的基因组比条叶蓝芥的小 15% 左右，其编码蛋白为 27059 个。在新的基因组中预测的 19000 多个 ORF 与条叶蓝芥的不同组织的转录组序列一致。总的来说，研究人员报道在 NCBI 的 BLASTN 数据库搜索的 53 ％的条叶蓝芥基因与拟南芥序列非常相似。 Oh 说，乍一看，两个基因组的基因组成是非常相似的，但他和他的同事发现两者的细微差别。值得注意的是，虽然条叶蓝芥和拟南芥基因组中含有类似数目的串联重复基因，但在两种植物中，重复的基因只有一半是重叠的。相反，条叶蓝芥基因组中似乎包含更多的参与逆境适应或其它未知功能的基因的重复。此外，与拟南芥转录组数据的比较表明条叶蓝芥基因组中含有过量的发育相关、生物和非生物刺激的反应相关和转运蛋白相关的基因。另一方面，研究人员报道，与拟南芥相比，条叶蓝芥似乎有很少的信号传导基因。 Oh 说，研究人员继续研究导致叶蓝芥抗逆性优于拟南芥的基因组，基因和蛋白模式，包括特异性研究基因发生突变时，增加拟南芥逆境敏感性的基因。初步结果表明，在条叶蓝芥中，这些胁迫基因显示出不同的拷贝数，启动子，表达和蛋白质功能模式。新闻源自 www.genomeweb.com , 毅新兴业供稿，更多信息请点击 www.bioyong.com

个人分类: 新一代测序技术服务|3673 次阅读|0 个评论

GenomeWeb发文介绍R10K项目

热度 2 SNPs 2011-5-25 05:00

读者很多的GenomeWeb最近报道了我们启动 R10K项目的新闻（点击看全文）：这个项目的启动意义重大： “Our immune system is the most sensitive and specific in recognizing external or internal "threats", it negotiates with the environment daily and ready to react through its diversified T and B cells. ” 换句话说，免疫系的T细胞和B细胞受体能特异而且高效地和疾病相关的抗原结合，通过高通量测序，我们就可以顺着这个高度特异和敏感的“藤”摸到诊断疾病的“瓜”。以前的技术不能把免疫细胞细分到单细胞水平，所以分辨率比较低。有了免疫组库测序技术，找到与疾病相关的特异性抗原结合的免疫细胞就成了可能。

个人分类: 免疫组库新领域|6190 次阅读|1 个评论

全球高通量测序仪分布图

热度 3 SNPs 2011-2-19 01:49

看看世界上都有那里在做高通量测序？这也是iCubate为测序平台建库的潜在市场的分布图.

个人分类: 生物技术创新创业|8926 次阅读|2 个评论

测序能解决所有诊断问题吗？

热度 8 SNPs 2011-2-11 06:33

昨天，我们研究院请来了NIH国家基因组研究院技术研发协调主管， Jeffery Schloss博士做讲座。从基因组项目开始，大家就认识到如果用当时的技术测序，完成基因组项目需要几十年，更多的钱。所以从一开始，美国政府就鼓励，投入经费开发各种新的测序技术。他手头主管着大笔经费的分发权，几乎所有新的测序技术的开始都得到过他主管部门的资助。这个幻灯可以看到测序价格（从07年开始）的大幅下降是第二代测序技术（以454, Solexa 等为代表的技术）引起的“革命”的结果。我是07年九月加入HudsonAlpha研究院，开始知道新一代测序技术（454)，08年春天开始使用，夏天申请了有关免疫组库测序的首批专利。算是很早使用高通量测序的一批科学家。 Jeff 花了不少时间讲“下下代测序技术”（下一代是Pacific Bio为代表的技术）——nanopore. 第一代全自动测序仪（ABI)是完成人类基因组测序工作的骨干，其局限是需要克隆。可是到了基因组工程的后期，在测序仪以外的自动化，规模化也已经把价格降低了很多（见前面的幻灯片），但那是“线性”的降低，不是“曲线”降低。是第二代测序仪及其推广带来了价格的大幅下降。第二代测序技术把克隆这个瓶颈去掉了，但是还是需要做Library (建库），而且这个建库的过程很复杂，耗时，昂贵。所以这个建库的过程就成了下一个革命的对象。下面这张幻灯片讲测序技术发展的一个长远目标：希望能在三十分钟内，五十美金就能做病人的全基因组测序！坐在下面听Jeff讲座，渐渐有一个感觉：美国人真敢想！而且想到的，没多久就都做到了！！ 2003年基因组草图完成的时候，如果再测一个基因组，需要3个月的时间，一百台仪器（ABI)大概五千万美金；到了07年，有了二代测序仪器的时候，测一个基因组就需要一台仪器，一个月了；现在可能一台仪器一个星期能测两个基因组！短短十年的时间，测序价格降低了100倍！这里一个小插曲：前天晚上和研究院的几个同事一起请Jeff吃晚饭，几杯啤酒后谈起华大基因的经营模式。有人说，其实承包测序赚钱并不难：因为按照测序价格下降曲线（有点象电脑行业芯片价格下降的摩尔法则）去推测，几乎每半年价格下降一倍。所以只要上半年按照当时的价格去接活，推迟半年再去测序，价格就已经自动降低一半了！讲座完后又有幸和Jeff交谈了一个多小时，向他介绍了我们做免疫组库方面的工作进展。本来我一月底应邀去NIH的两个部门做讲座的，结果因为大雪没能成行，推迟到三月底（但愿那个时候就没有雪了，很难说）。这次Jeff又给我推荐了几个可能的合作者。和他交谈时，我问他：“你觉得测序真的能解决所有诊断问题吗？”我说，其实这是两个问题，一是“是否所有诊断都需要测序？”，另一个是“测序是否永远是最佳选择？”而这些问题的前提是测序的技术问题已经得到圆满解决（包括标本处理）。他的回答和我预料的一样是否定的。其实，在这个问题的背后是我对我们现有技术命运的关心：人们还需要用多重PCR技术做核酸扩增吗？还需要杂交检测吗？我的感觉是，测序作为一种核酸检测技术可能很快就能替代以杂交为基础的检测技术，但是PCR扩增技术还是有很长的寿命的。原因是测序不能增加信噪比。比如感染性疾病，如果取病人的血液直接测序，除了发现少量的病原体基因组（诊断用的信号）以外，绝大多数的测序结果都是人的基因组序列（噪音），而取血的针头穿过皮肤的时候也可能带上几个皮肤上的病原体，如何区分？再有，如果做免疫组库的测序，每个免疫细胞可能表达几个mRNA是T细胞受体（信号），而绝大多数mRNA是其它基因（噪音），而且不同的细胞表达的还是不同的T细胞受体基因（多种信号），所以如何区分？我以前也讨论过，诊断，永远是玩信噪比，而PCR扩增是增加信噪比的有效手段。所以不能把测序神话了，哪怕是测序技术已经到了炉火纯青的地步，其它技术还是有用武之地的。更何况，测序技术还远没有达到可以直接上临床的地步，还有许多事情可以做，需要做：标本处理，建库的自动化，信息处理，规模化，稳定化，合法化（报批），市场化。。。

个人分类: 生物技术创新创业|6703 次阅读|9 个评论

关注国产高通量测序-深圳华因康

热度 2 nooney1986 2011-1-21 14:44

由于自己是从事核酸分析技术的一员，核酸技术不外乎PCR(普通PCR and Real-time PCR)，Chip(microfludic and microarray)和sequencing,而现在尤其以高通量测序技术最为耀眼，当国外的测序技术发展的如火如荼时，国内的学术界和产业界却显得有些寂静，除了华大购买国外成套的仪器和设备从事着测序工厂的低端工作，国内好像并没有太多的科研机构和公司从事测序仪器及配套试剂的开发，如果我们的科研平台受制于人的话，就很难进行原始创新，在基因组科学的发展中又会重蹈覆辙。如今传统的测序市场主要由ABI的3730占据，第二代测序技术以Roche 454, Illumina Solexa以及ABI Solid为代表，价格都在50万美金以上，还不包括试剂费用，从事第三代测序技术开发的公司有pacific和complete gene 公司，大多都基于单分子纳米孔测序原理目前成熟的产品有Iron推出PGM（Personal genome machine）,现在我向大家介绍一家国产从事测序仪器和试剂开发的公司-深圳华因康。深圳华因康是一家专业研发、生产、销售超高通量基因测序设备及配套生物试剂、基因分析软件、生物信息数据技术服务为主体的生命科学领域的高科技企业。2010年，深圳华因康推出自己的高通量测序系统，包括了全套的生物试剂和信息系统分析软件( http://www.s1979.com/a/news/sz/2010/0726/54074.shtml )

个人分类: 生物产业观察|1914 次阅读|0 个评论

高通量RNA结构测序研究进展与文献分析

xupeiyang 2010-12-9 16:01

科学家发明高通量RNA结构测定方法 http://lab.sciencenet.cn//htmllab/2010129134026697333.shtm FragSeq: transcriptome-wide RNA structure probing using high-throughput sequencing http://www.nature.com/nmeth/journal/v7/n12/full/nmeth.1529.html#/abstract http://www.gopubmed.org/web/gopubmed/1?WEB1mOWEB10O00d000j10020001000h00100090000 RNA and high-throughput sequencing 560 documents semantically analyzed Top Years Publications 2010 177 2009 119 2008 73 2007 38 2006 28 2004 27 2005 24 2003 18 2002 18 2001 12 2000 11 1998 5 1999 4 1997 3 2011 2 1 2 Top Countries Publications USA 259 United Kingdom 40 Germany 39 China 37 France 21 Canada 19 Spain 16 Japan 16 Australia 13 Italy 11 Switzerland 8 Sweden 8 South Korea 6 Norway 6 Taiwan 5 Denmark 4 Brazil 4 Netherlands 4 Singapore 4 Russia 3 1 2 1 2 3 ... 12 Top Cities Publications Cambridge, USA 14 Cambridge 13 New York City 12 Berlin, Germany 11 Beijing, China 10 San Diego 10 San Francisco 9 Seattle 9 Stanford 9 Norwich 9 Rockville 8 Boston 8 Shanghai, China 8 St. Louis 8 Corvallis 8 Barcelona 7 Los Angeles 7 Heidelberg 6 East Lansing 6 Philadelphia 5 1 2 3 ... 12 1 2 3 ... 12 Top Journals Publications Nucleic Acids Res 41 Bmc Genomics 34 Genome Res 23 Plos One 17 Proc Natl Acad Sci U S A 13 Bioinformatics 12 Bmc Bioinformatics 11 Methods Mol Biol 10 Rna 9 Nature 8 Nat Methods 8 Plos Genet 8 Genome Biol 7 J Clin Microbiol 6 Nat Biotechnol 6 Virology 5 Bmc Plant Biol 5 Methods 5 N Biotechnol 5 J Biol Chem 5 1 2 3 ... 12 1 2 3 ... 192 Top Terms Publications Genes 366 RNA 333 Genomics 283 Genome 282 Humans 232 Base Sequence 211 Gene Expression Profiling 208 Technology 190 DNA 181 Animals 175 gene expression 170 Gene Expression 164 regulation of gene expression 155 RNA, Messenger 150 Sequence Analysis, DNA 133 Proteins 120 mannosyl-oligosaccharide 1,2-alpha-mannosidase activity 120 Polymerase Chain Reaction 115 DNA, Complementary 113 MicroRNAs 104 1 2 3 ... 192 1 2 3 ... 139 Top Authors Publications Moulton V 4 Ronaghi M 3 Carninci P 3 Maclean D 2 Hansen K 2 Morozova O 2 Chi S 2 Lee L 2 Jakobsen K 2 Bckman T 2 Magrini V 2 Jalili R 2 Kasschau K 2 Sullivan C 2 Cumbie J 2 Chapman E 2 Fahlgren N 2 Givan S 2 Carrington J 2 Meyers B 2 1 2 3 ... 139

个人分类: 信息分析|4518 次阅读|0 个评论

基于高通量测序的基因功能研究方法

bioysy 2010-9-30 00:23

高通量测序当然是革命性的技术，而且成本在不断降低，总有一天能降到能够接受的程度，所以我非常关注高通量测序方法的应用，目前的先驱性研究可能会成为今后的主流技术手段。综述文章Utilization of next-generation sequencing platforms in plant genomics and genetic variant discovery Utilization of next-generation sequencing platform 选择性基因型鉴定和高通量测序的结合Population resequencing reveals local adaptation of Arabidopsis lyrata to serpentine soils Population resequencing reveals local adaptation 定位到500多bp的区间后，用高通量测序的方法发现目标基因Identification of a spontaneous frame shift mutation in a nonreference Arabidopsis thaliana accession using whole genome sequencing Identification of a spontaneous frame shift mutati 选择性基因型鉴定和高通量测序的结合Bulk Segregant Analysis by High-Throughput Sequencing Reveals a Novel Xylose Utilization Gene from Saccharomyces cerevisiae Bulk Segregant Analysis by High-Throughput Sequenc 侯选基因的高通量测序（PCR片段的高通量测序）High-throughput, pooled sequencing identifies mutations in NUBPL and FOXRED1 in human complex I deficiency High-throughput, pooled sequencing

个人分类: 未分类|5972 次阅读|1 个评论

[转载]高通量测序技术——第二代测序技术

flysui 2010-9-16 09:09

高通量测序技术第二代测序技术高通量测序技术是对传统测序一次革命性的改变，一次对几十万到几百万条DNA分子进行序列测定，因此在有些文献中称其为下一代测序技术(next generation sequencing)足见其划时代的改变，同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能，所以又被称为深度测序(deep sequencing)。自从2005年454LifeSciences公司（2007年该公司被Roche正式收购）推出了454FLX焦磷酸测序平台（454FLXpyrosequencingplatform）以来，曾推出过3730xlDNA测序仪（3730xlDNAAnalyzer）的Applied BioSystem（ABI）这家一直占据着测序市场最大份额的公司的领先地位就开始动摇了，因为他们的拳头产品毛细管阵列电泳测序仪系列（seriescapillaryarrayelectrophoresissequencingmachines）遇到了两个强有力的竞争对手，一个就是罗氏公司(Roche)的454 测序仪(Roch GS FLX sequencer)，，另一个就是2006年美国Illumina公司推出的Solexa基因组分析平台（GenomeAnalyzer platform），为此，2007年ABI公司推出了自主研发的SOLiD 测序仪(ABI SOLiD sequencer)。这三个测序平台即为目前高通量测序平台的代表。（见表一）公司名称技术原理技术开发者商业模式 Apply Biosystems(ABI) 基于磁珠的大规模并行克隆连接DNA测序法美国Agencourt私人基因组学公司（APG）上市公司：销售设备和试剂获取利润 Illumina 合成测序法英国Solexa公司首席科学家David Bentley 上市公司：销售设备和试剂获取利润 Roche 大规模并行焦磷酸合成测序法美国454 Life Sciences公司的创始人Jonathan Rothberg 上市公司：销售设备和试剂获取利润 Helicos 大规模并行单分子合成测序法美国斯坦福大学生物工程学家Stephen Quake 上市公司：2007年5月首次公开募股（IPO） Complete Genomics DNA纳米阵列与组合探针锚定连接测序法美国Complete Genomics公司首席科学家radoje drmanac 私人公司：投资额为4650万美元表一：主流测序平台一览这些平台共同的特点是极高的测序通量，相对于传统测序的96道毛细管测序，高通量测序一次实验可以读取40万到400万条序列。读取长度根据平台不同从25bp到450bp，不同的测序平台在一次实验中，可以读取1G到14G不等的碱基数，这样庞大的测序能力是传统测序仪所不能比拟的。尽管如此，在这项新的划时代的测序技术刚出现的时候，科学界对这项新技术却并不热衷。许多习惯用桑格技术的科学家怀疑新技术的准确度、阅读能力、成本消费、实用性。代理Sanger型测序硬件的经销商害怕其投资失败而首先提出了这些怀疑。图一：在芯片上进行的测序：Illumina测序平台然而大多数人却忽略了一个事实，即桑格技术的普及最初也遇到同样的阻碍。桑格技术刚开发出来时，阅读能力很难超过25bp，即使在Fred Sanger双脱氧终止法发明后也只达到80bp，如今却达到了750bp；而新发展的合成测序技术，应用焦磷酸测序方法，其阅读能力最初只有 100bp，推向市场16个月后增加至250bp，随着技术的不断完善，目前已达到了400bp，很快就接近桑格技术目前的水平。除了阅读能力外，能否以有限的成本用一台仪器产生足够数量的序列标记也是另一个需要改善的重要问题。这个问题已经被Roche公司解决了，应用他们的系统，仅花费阅读35bp或者更小片段的成本就能产生比35bp多10倍的序列标记。图二：GS FLX 高通量测序方法原理示意图一、高通量测序的应用高通量测序可以帮助研究者跨过文库构建这一实验步骤，避免了亚克隆过程中引入的偏差。依靠后期强大的生物信息学分析能力，对照一个参比基因组 (reference genome)高通量测序技术可以非常轻松完成基因组重测序(re-sequence)，2007年van Orsouw等人结合改进的AFLP 技术和454 测序技术对玉米基因组进行了重测序，该重测序实验发现的超过75%的SNP位点能够用SNPWave技术验证，提供了一条对复杂基因组特别是含有高度重复序列的植物基因组进行多态性分析的技术路线。2008年Hillier对线虫CB4858 品系进行Solexa重测序，寻找线虫基因组中的SNP位点和单位点的缺失或扩增。但是也应该看到，由于高通量测序读取长度的限制，使其在对未知基因组进行从头测序( novo sequencing)的应用受到限制，这部分工作仍然需要传统测序(读取长度达到850 碱基)的协助。但是这并不影响高通量测序技术在全基因组mRNA表达谱，microRNA表达谱，ChIP-chip以及DNA甲基化等方面的应用。 2008年Mortazavi等人对小鼠的大脑、肝脏和骨骼肌进行了RNA 深度测序，这项工作展示了深度测序在转录组研究上的两大进展，表达计数和序列分析。对测得的每条序列进行计数获得每个特定转录本的表达量，是一种数码化的表达谱检测，能检测到丰度非常低的转录本。分析测得的序列，有大于90%的数据显示落在已知的外显子中，而那些在已知序列之外的信息通过数据分析展示的是从未被报道过的RNA剪切形式，3端非翻译区，变动的启动子区域以及潜在的小RNA 前体，发现至少有3500个基因拥有不止一种剪切形式。而这些信息无论使用芯片技术还是SAGE文库测序都是无法被发现的。高通量测序另一个被广泛应用的领域是小分子RNA或非编码RNA(ncRNA)研究。测序方法能轻易的解决芯片技术在检测小分子时遇到的技术难题 (短序列，高度同源)，而且小分子RNA的短序列正好配合了高通量测序的长度，使得数据不浪费，同时测序方法还能在实验中发现新的小分子RNA。在衣藻、斑马鱼、果蝇、线虫、人和黑猩猩中都已经成功地找到了新的小分子RNA。在线虫中获得了40 万个序列，通过分析发现了18个新的小RNA分子和一类全新的小分子RNA。在DNA蛋白质相互作用的研究上，染色质免疫沉淀深度测序(ChIP-seq)实验也展示了其非常大的潜力。染色质免疫沉淀以后的DNA 直接进行测序，对比ref seq可以直接获得蛋白与DNA结合的位点信息，相比ChIP-chip，ChIP-seq可以检测更小的结合区段、未知的结合位点、结合位点内的突变情况和蛋白亲合力较低的区段。图三: Independent Flow Cells（SoLid TM System）二、高通量测序的前景目前，大多分析家都无法相信新一代测序技术能完全取代目前的芯片测序技术。不过，有些分析家也的确认为芯片测序技术正面临着挑战，他们认为到了2012年新一代的测序技术将会带来高达2。15亿美元的产值。 2006年，整个芯片测序市场大概价值8亿美元，其中65%的市场份额都是有关基因表达谱分析产品的，剩下35%的市场份额则由基因型分析芯片占据。不过美国哈佛大学（HarvardUniversity）遗传学教授George Church认为，这部分市场也会受到新一代测序技术的冲击。重测序芯片（resequencingarrays）、单核苷酸多态性分析芯片以及基因拷贝数目变异分析芯（copynumbervariantarray）市场也会受到影响。也有分析家不赞同这个观点，他们认为即使新一代测序技术很便宜，还是有不少人会选择传统的测序仪的。新一代测序技术相对传统芯片测序技术的优势，最终还得依靠广告和市场营销手段的推广才能获得大众的认可。去年夏天，由 FrostSullivan公司对学术科研机构和私人研究团体进行的一项调查研究结果表明，在实际应用领域，例如进行表达谱分析时，人们还是倾向于选择传统的芯片产品，而并非青睐新一代的测序产品。新一代测序仪推广困难可能由其价格昂贵导致。平均采购一台新一代测序仪大约要花费50万美元，除非该实验室测序的工作量非常大，否则是不会考虑购买的。即使像Polonator这样的新一代测序仪也需要花费15万美元左右，这笔费用对于一个小实验室来说是无法承受的。这时，只需要150美元一块的芯片就非常有竞争力了。以基因芯片产品享誉业界的美国Affymetrix公司市场部副总裁Jay Kaufman认为，新一代测序技术对于芯片市场来说的确会带来一定的冲击，不过要完全取代表达谱分析芯片还需要一定的时间。但是，基因芯片也有其自身的缺点，就在于它是一个封闭系统，它只能检测人们已知序列的特征(或有限的变异)。而高通量测序的强项，就在于它是一个开放系统，它的发现能力和寻找新的信息的能力，从本质上高于芯片技术。研究者可以充分享受这两个平台的比较优势，在获取新信息的基础上，利用芯片的强项，即对已知信息的高通量、低成本(相对)的检测能力，对大量样品进行快速检测，短时间内获得有大量有效的数据。作为两个高通量的基因组学研究技术，在应用的某些方面存在重叠和竞争，但是在更多方面是优势互补，两种方法联合使用，将解决以前的单种技术难以解决的问题。三、结语新一代测序已显示出巨大的潜力。也正是因为科学的不断进步，在给测序技术提出新要求的时候，也给这项技术带来了新的增长点： 2008年4月Helico BioScience公司的Timothy等人在Science上报道了他们开发的真正的单分子测序技术，也被称为第三代测序技术，并利用该技术对一个 M13病毒基因组进行重测序。这项技术之所以被称为真正的单分子测序，是因为它完全跨过了上述3种高通量测序依赖的基于PCR扩增的信号放大过程，真正达到了读取单个荧光分子的能力，向1000美元测定一个人类基因组的目标迈出了一大步。

个人分类: 未分类|5072 次阅读|0 个评论

高通量DNA测序技术在生物学研究的应用

toptip 2009-10-21 11:14

导读：有很多生物学工作者尽管知道高通量技术的大概原理，但是却以为它仅仅是更快而已。其实高通量DNA测序技术不仅仅是替换传统的测序技术，它有三大优点是毛细管测序法所不具备的。首先它把平行处理的思想用到极致，可以在几百万个点上同时阅读测序，所以它是快速高通量的技术，这一点是大家所熟知的；另外它实质上是单分子DNA的测序技术，通过单分子DNA结合在某个点上进行扩增测序，所以它可以测一个DNA的mixture（混合）；最后由于在一个mixture中某种DNA的丰度反应在它能在多少点上结合并被测序，也就是说被测序的次数反应了DNA的丰度，这个技术还有非常完美的定量功能。高通量DNA测序技术已经在如下领域掀起了革命。测基因组的： 1.re-annotationofthegenome。测序难免有错误，通过反复的深度测序，可以将这种错误降低到很小。另外通过反复测cDNAlibrary，纠正了以前splicing位点的错误。大规模地，便宜地，快速地测物种的序列，比如果蝇的subspecies的序列，对于理解进化非常有必要。 2.疾病相关基因以及突变的hotspot的发现。以前的测序可以通过设计很多已知基因的引物，对来自病人的很多sample的平行测序，可以发现它们突变的位点集中在哪里，然后通过其它功能实验（比如酶活变化，致癌能力）来确证。现在的测序技术可以coverwholeexon。比如收集某个病症的1000个sample，通过对这些sample平行测序，有可能denovo地发现新的致病基因突变。同理，从phenotype到genotype（比如狗的个体大小，最简单的是单基因导致的），理论上如果收集足够的样本，就可以用统计去除个体差异的背景，分离到这个genotype。 3.甲基化的pattern。通过亚硫酸氢钠处理后甲基化的胞嘧啶C不变，而普通胞嘧啶变成U的原理，可以定量地看在genome上DNA甲基化的pattern。测cDNA的： 1.现有的技术已经基本上取代了ChIP-chip。以前array的chip，在定量方面有很大的缺陷，原来差异在100倍的，反应在信号的上的差异可能只有30倍，信号饱和。现在的技术是通过hit目的片段的次数来定量的，也就是表达量越高，基因越大，被测序的次数也越多。这种定量比chip要准确很多。 2.完全并且更好地取代array。比如细胞分化过程，应激反应过程中基因表达的变化。可以通过cDNA库的测序，更加定量地，可重复地记录这个过程。有些物种的array没有商业化，如果自己设计定制array成本很高。而深度测序技术无需自己定制array就可以直接进行。在这种情况下，现在的测序技术成本已经比array要低了。总之，高通量DNA测序技术不仅只是来测基因组，它还可以作为readout。这个就是技术促进生物学研究的很好的例子。以前不敢想的，现在有办法做了。另外提一句：深度测序技术的应用会越来越广泛，它会产生海量数据。以后纯粹靠生化或者分子生物学技术的实验室将会很难生存，这就是我认为以后每个学生物的学生都必须掌握生物信息学，统计学的重要原因。

个人分类: 科普集锦|16185 次阅读|8 个评论

帐号		自动登录	找回密码
密码			注册

关闭安全验证

标签: 高通量测序

相关帖子

相关日志

关闭 安全验证

标签: 高通量测序

相关帖子

相关日志

关闭安全验证