博文

Nature 子刊：三代测序的DNA提取和宏基因组学分析

已有 3082 次阅读 2021-5-15 11:57 |个人分类:读文献|系统分类:科研笔记

改进的人类肠道微生物组的高分子量DNA提取，纳米孔测序和宏基因组学装配

Improved high-molecular-weight DNA extraction,
nanopore sequencing and metagenomic
assembly from the human gut microbiome

Nature Protocols [IF: 10.419]

DOI：https://doi.org/10.1038/s41596-020-00424-x

发表日期：2020-12-04

第一作者：Dylan G. Maghini¹

通讯作者：Ami S. Bhatt
(asbhatt@stanford.edu)^1,2

合作作者： Eli L. Moss,Summer E. Vance

主要单位：

¹美国斯坦福大学遗传学系(Department of Genetics, Stanford University, Stanford, CA, USA)

¹美国斯坦福大学医学系(Divisions of Hematology and Blood & Marrow Transplantation, Department of Medicine, Stanford University, Stanford, CA, USA)

写在前面

分享标题：Nature 子刊：三代测序的DNA提取和宏基因组学分析

关键字：宏基因组学，生物信息学，文库制备，长读长测序，人类肠道菌群，高分子量DNA

摘要

人类肠道菌群的短读长宏基因组测序和从头基因组组装无需分离和培养即可获得细菌基因组草图。然而，由短读长测序组装的细菌基因组通常是片段化的。此外，这些由宏基因组组装的基因组通常不包括重复的基因组元件，例如移动遗传元件，从而损害了我们对这些元件对重要细菌表型贡献的理解。虽然长读长测序已成功应用于连续细菌分离基因组的装配，但从粪便样本中提取足够分子量、纯度和数量以进行宏基因组测序的DNA可能具有挑战性。在此，我们提出了一种从人类粪便样本中提取微克量的高分子量DNA的方法，该方法适用于下游长读长测序的应用。我们还介绍了Lathe (www.github.com/bhattlab/lathe)，这是一种用于长读长碱基识别、组装、长读长和Illumina短读长的校对和基因组环化的计算工作流程。总而言之，此方法可以在大约10天内，包括2天的实验操作和计算下从复杂的人类肠道样本中产生高质量的连续或环状细菌基因组。

步骤概述

在这里，我们描述了从人粪便样品中提取高分子量(HMW)DNA的改进方案(图1)，以及对测序方法的建议以及用于长读长数据的宏基因组组装/拼接的工作流程(图2)。具体来说，我们描述了用于酶促细菌细胞裂解(步骤2-4)，RNA和蛋白质消化(步骤7)，样品纯化(步骤8和9)和DNA片段选择(步骤13-15)的方法以及我们针对长读长组装软件、抛光方法和错误校正的建议。浓缩DNA的提取方法见补充说明1。

图 1 高分子量DNA提取工作流程

High-molecular-weight DNA extraction workflow

翻译如下图

最好使用带柱塞的活检打孔器将冰冻的粪便等分，并特别注意刀刃。将粪便分成等份试样后，DNA提取工作流程将继续进行样品悬浮，酶解和化学裂解以及DNA纯化。Qiagen Genomic-tip是一种基于色谱柱的纯化方法，旨在最小化DNA的剪切。使所有试剂在重力作用下流过基因组尖端色谱柱；请勿使用注射器或真空泵抽液，因为这会损坏色谱柱。提取DNA后，选择大片段以使用在定制缓冲液中制备的SPRI珠子。应分别使用Qubit荧光计，NanoDrop分光光度计和Agilent TapeStation评估提取的DNA的浓度，污染情况和大小分布。DNA被提取并达到质量阈值后，可以通过文库制备方法进行纳米孔测序。 EtOH-乙醇。

图 2 测序后生物信息学分析工作流程

Post-sequencing bioinformatic workflow

翻译如下图

测序完成后，在使用Flye或Canu组装软件进行组装之前，使用计算组装工作流程(步骤25)对原始纳米孔信号进行碱基识别。然后，工作流程提供了可选的修饰步骤，方法是将短或长读长与组装片段比对，并用比对读长的共有碱基(橙色)校正单个核苷酸错误和插入缺失(绿色)。最后，工作流用于通过自我对齐和修剪或末端重叠群的装配来执行环化步骤。

优势与局限

这种DNA提取方法已被优化用于从人类粪便样本中提取高分子量(HMW)DNA，但也已在模拟微生物群落和细菌分离株上得到验证。我们希望该方案可以适用于其他样品类型，尽管可能需要对裂解前和裂解后步骤进行修改以解释特定于样品的制备和污染物清除的问题是必要的。机械裂解方法（如珠子击打）仍然是连续裂解和下游相对丰度分类的金标准，因为与酶解法相比，机械裂解法的偏差更小。然而，我们以前已经证明，这种酶解法对革兰氏阳性和革兰氏阴性的生物都能进行相对一致的裂解。此外，尽管在大量投入样品的情况下机械裂解方法可能就足够了，因此可以进行广泛的大小选择，但我们的方法可以优化DNA的高产量，并且在输入样品量有限的情况下非常有利。

我们用于碱基识别，组装和环化的下游计算工作流程专为从纳米孔或PacBio测序生成的易错，长读长测序数据而设计。由于纳米孔测序会在均聚物区域产生较高的错误率，而PacBio测序具有较高但相对随机的错误率，因此仍建议使用短读长进行修正以进行插入缺失校正和高质量组装。我们发现，当短读长没有均匀地覆盖重叠群时，短读长修正效果会受到影响(例如，在从不同的DNA提取物中产生短长的情况下，或在某些短读长文库制备方法中修饰有偏差的低GC区域时)。我们预计，随着对长读长测序技术和碱基识别(比如PacBio循环一致测序和神经网络碱基识别)的未来改进，对短读长进行额外修正的需求将变得不再那么紧要。

替代方法

从粪便中提取DNA时，珠子敲打(球磨)是酶促裂解的最常见替代方法。实际上，这种机械裂解方法已被广泛用于复杂基质中革兰氏阳性和革兰氏阴性细菌的裂解。尽管通过球磨获得的DNA在很大程度上被剪切而无法产生较长的读长，但随后的严格的尺寸选择步骤可以产生更高分子量的DNA。这种方法可能是有利的，因为球磨可以有效地溶解多种生物。然而，在球磨后获得的DNA大多被剪切成非常小的尺寸，因此尺寸选择后的DNA产量往往受到限制。这种低产量的问题可以通过对具有足够生物量和数量的样品进行多次平行提取来克服。使用球磨时，另一个需要考虑的因素是，大小选择可能很少获得更容易裂解且具有更短、更易剪切的DNA的生物。

步骤

DNA提取

DNA extraction

耗时8小时

1 尽可能地将冷冻的粪便样本放在干冰上(以保持样本完整性)，将样本管放在试管架上，并使用活检打孔器将150 mg的粪便等分试样分配到2 ml微量离心管中。对于较低生物量的粪便样品，请准备多达300 mg粪便的等分试样。

！注意所有样品均应在知情同意下并按照相关准则获得。

！注意
活检打孔器是锋利的物体，在准备等份试样时很容易滑落。准备等分试样时，请勿用手抓住样品管。

2 将样品悬浮于500 μl PBS中并涡旋3–4 s进行混合。向粪便悬浮液中加入5 μl Qiagen裂解酶溶液和10 μl MetaPolyzyme。轻微缓慢地颠倒六次进行混合。在37°C孵育混合物1小时。
3 在通风橱中，加入12 μl的20％(wt/vol)SDS和500μl的苯酚/氯仿(pH 8)。在微量离心管中加入约100 μl的
phase-lock。或者，将约100 μl的phase-lock添加到微量离心管的内盖中，而不是直接添加到离心管中以方便使用。

关键步骤 phase-lock的使用是可选的，但使下一步的移液更加容易。但是，使用比指定数量更多的phase-lock会对产量产生负面影响。

4 将试管放入多位置涡旋仪，并以最小速度涡旋5 s。在室温（18–21°C）下以10,000g离心5分钟。将水相倒入新的2 ml微量离心管中。
5 加入90 μl 3 M乙酸钠和500 μl异丙醇。将试管缓慢颠倒3次以混匀。将混合物在室温下孵育10分钟。
6 在室温下以10,000g的转速将管旋转10分钟，确保铰链面向外边缘。要非常小心，不要破坏小颗粒沉淀，用P200移液器取出并丢弃上清液。用100 μl新鲜制备的80％(体积/体积)的乙醇洗涤沉淀两次。
7 从基因组DNA缓冲液组(Qiagen)中加入1 ml缓冲液G2、4 μl RNase A(100 mg / ml)和25 μl蛋白酶K。将试管缓慢倒转3次以混合。将混合物在56°C的加热块中孵育1小时。孵育30分钟后，轻轻颠倒一次或两次以除去沉淀。

见疑难解答

8 在56°C条件下，预热每列来自基因组DNA缓冲液套装(Qiagen)的缓冲液QF1 ml。
9 用来自基因组DNA缓冲液套装（Qiagen）的1 ml缓冲液QBT平衡Genomic-tip 20 / G，并允许缓冲液通过重力流流入废物储存器。轻轻颠倒两次样品，然后将其涂在平衡的Genomic-tip上。允许通过重力流进入树脂。用来自基因组DNA缓冲液套装(Qiagen)的1 ml缓冲液QC洗涤Genomic-tip端3次。将Genomic-tip放在2 ml收集管上方。用1 ml预热的缓冲液QF将基因组DNA洗脱到收集管中。

关键步骤

Genomic-tip不应该被强行压入试管中。它必须位于废物容器和收集管上方。如果没有其他合适的设置，通常可以通过使用试管架和/或移液器吸头盒来完成。

见疑难解答

10 加入700 μl(0.7体积)室温下的异丙醇沉淀基因组DNA。轻轻颠倒试管以混合并在室温下孵育10分钟。
11 在室温下以10,000g离心15分钟。用P200移液器除去上清液，并用200 μl 80％（体积/体积）乙醇洗涤沉淀。用移液器除去80％的乙醇。

关键步骤

沉淀可能很小，可能会从管壁上脱落。不要试图用移液器吸掉所有80％的乙醇，因为这可能会除去沉淀物。相反，要留下一小部分乙醇和沉淀物。

12 将试管盖打开10–20分钟，直到乙醇池中≤10μl，风干沉淀物和剩余的80％乙醇，但不要完全干燥沉淀物。轻轻地重悬于200 μl无核酸酶的水中。

暂停点

提取的DNA可以在4°C下保存几个月。

13 按照“试剂设置”中的指定，在自定义缓冲液中准备磁珠。将0.8体积（160 μl）的定制磁珠悬浮液添加到试管中，轻弹以进行混合。在室温下在Hula混合器中将试管孵育10分钟。

关键步骤

每次定制缓冲液的制备，磁珠悬浮液与样品的比率都会有所不同。用非贵重的样品测试每种微珠制剂的选择严格性，以确保正确选择。

14 短暂地向下旋转试管，然后将试管放在磁力架上以沉淀珠子。等待〜3分钟或直到溶液变得澄清为止。用P200移液器小心除去上清液。用200μl新鲜制备的80％乙醇（体积/体积）洗涤沉淀的珠子，然后用移液器吸去乙醇。再次重复洗涤步骤。从磁力架上取下试管，快速旋转，将试管放回磁力架上，用移液管吸掉残留的乙醇。风干珠粒30 s。

关键步骤

不要过度干燥珠子，因为这可能会对DNA的回收产生不利影响，并可能导致DNA与珠子不可逆地结合。

15 从磁力架上取下试管，然后将磁珠重悬于50 μl无核酸酶的水中。如果要进行快速测序文库制备方案，请重新悬浮于15 μl无核酸酶的水中。将悬浮液在37°C下孵育10分钟。在磁架上沉淀珠子约3分钟或直到溶液变澄清为止，然后将洗脱液转移到新的微量离心管中。

暂停点

提取的DNA可以在4°C下保存几个月

16 使用Qubit定量DNA浓度。建议的最小浓度为20 ng / μl。

见疑难解答

17 通过使用nanodrop定量DNA纯度。建议的纯度为A260 / A230> 2，A260 / A280> 1.8。

见疑难解答

18 使用安捷伦TapeStation或类似产品量化DNA大小分布。建议的大小分布是主要峰均值> 15 kb，最小质量(<50荧光单位)<2.5 kb。

暂停点

提取的DNA可以在4°C下保存几个月。

见疑难解答

文库制备和测序

耗时4天

关键

该方案用于文库制备和随后的Oxford Nanopore MinION测序。对于在其他Oxford Nanopore或PacBio平台上进行测序，请遵循为这些平台设计的方案。

19 按照牛津纳米孔技术通过连接(SQK-109; https://community.nanoporetech.com/protocols/gDNA-sqk-lsk109/v/GDE_9063_v109_revT_14Aug2019)的为基因组DNA测序方法进行测序准备DNA。按照以下步骤修改说明。在适配器连接和清理步骤中，将连接反应在Hula混合器上孵育，以完成所有孵育步骤。用长片段缓冲液洗涤珠子以富集超过3 kb的片段。对于最后的洗脱温育步骤，请在37°C而不是室温下孵育。
20 将RevD R9.4 MinION流通池(或类似产品)加载到MinION测序设备中，检查流通池质量，并按照连接基因组DNA中的说明加载制备的样品。

见疑难解答

21 按照以下说明开始进行测序运行，并进行以下修改。将运行时间设置为96 h，因为在默认运行时间过去之后，流通池可能仍然有效。关闭动态碱基识别，因为碱基识别被集成到Lathe工作流程中(详见下文)。将数据输出路径设置为具有≥500GB存储空间的位置，可以选择使用外部固态硬盘驱动器。
22 运行进行后且<10个孔仍然有效，请停止测序运行。

关键步骤

根据样品纯度和流通池中活性孔的原始数量，此步骤可能需要1-4天。对于下游装配应用，我们建议生成6Gbp的长读长数据。装配的连续性将随着覆盖深度的增加而提高。

宏基因组组装与后处理

耗时5天

关键

由于碱基识别，组装，修正和循环化是资源密集型过程，因此我们建议在高性能计算环境中执行所有计算分析。

23 安装miniconda3 (https://docs.conda.io/en/latest/miniconda.html)，Snakemake28和Singularity。从(https://github.com/bhattlab/lathe)复制Lathe GitHub存储库，并将config.yaml文件复制到工作目录中。
24 按照所需的参数编辑config.yaml文件，如在Lathe GitHub存储库上所述的那样。特别是，选择Canu或Flye进行装配，然后将Lathe配置为长读长修正(默认)，通过进入短读长的路径来进行短读长修正，通过使用polish_both参数进行长读长和短读长读取的修正，或者通过使用skip_polishing参数不进行修正。
25 如Lathe GitHub存储库中所述，通过使用Snakemake运行Lathe流程。如果先前已经进行了碱基识别，则可以按照GitHub存储库中的指示，通过预加载最终的碱基识别FASTQ文件来绕过此步骤。
26 可以在示例子目录的5.final文件夹中以FASTA格式找到汇编输出。通过使用分箱工具（例如MetaBAT2或DAStool）对最终的Lathe组装进行后处理。环状基因组可以FASTA格式在3.circularization / 3.circular_sequences目录中找到。

疑难解答

疑难解答建议见表1。

耗时

步骤1–18，DNA提取：8小时

步骤19–22，文库制备和测序：≤4天

步骤23–26，宏基因组学组装和后处理：5 天

预期结果

该方法描述了从人类粪便样品中提取、测序组装和分箱高分子量DNA的具体实验步骤；根据我们的经验，我们发现此处描述的DNA提取方法可从最初投入的300-500 mg粪便中产生1-2μgDNA。该DNA的大小分布峰为15–50 kb，足以用于无需PCR扩增和随后在Oxford Nanopore MinION测序仪上测序的文库制备。我们发现这些方法能够在MinION R9.4流通槽上生成6–30 Gbp的长读长数据。根据我们的经验，Lathe工作流程能够从具有6 Gbp长读长数据的复杂肠道宏基因组中产生至少一个环状细菌基因组。但是，这些结果可能会因覆盖率，肠道复杂性，DNA片段大小和细菌基因组结构而异。

Reference

Dylan G. Maghini, Eli L. Moss, Summer E. Vance & Ami S. Bhatt. (2021). Improved high-molecular-weight DNA extraction, nanopore sequencing and metagenomic assembly from the human gut microbiome. Nature Protocols 16, 458-471, doi: https://doi.org/10.1038/s41596-020-00424-x

写在后面

为鼓励读者交流、快速解决科研困难，我们建立了“宏基因组”专业讨论群，目前己有国内外5000+ 一线科研人员加入。参与讨论，获得专业解答，欢迎分享此文至朋友圈，并扫码加主编好友带你入群，务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助，首先阅读《如何优雅的提问》学习解决问题思路，仍未解决群内讨论，问题不私聊，帮助同行。

学习扩增子、宏基因组科研思路和分析实战，关注“宏基因组”

点击阅读原文，跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA

转载本文请联系原作者获取授权，同时请注明本文来自刘永鑫科学网博客。
链接地址：https://m.sciencenet.cn/blog-3334560-1286664.html

上一篇：Nature子刊：英属哥伦比亚大学揭示植物塑造根际微生物组新机制
下一篇：NBT：人类肠道培养细菌的1520个基因组

woodcorpse的个人博客分享 http://blog.sciencenet.cn/u/woodcorpse

博文

Nature 子刊：三代测序的DNA提取和宏基因组学分析

改进的人类肠道微生物组的高分子量DNA提取，纳米孔测序和宏基因组学装配

写在前面

摘要