博文

QIIME 2教程. 21进化树推断q2-phylogeny(2020.11)

已有 2837 次阅读 2021-2-3 22:01 |个人分类:QIIME2|系统分类:科研笔记

使用q2-phylogeny进行系统发育推断

Phylogenetic inference with q2-phylogeny

https://docs.qiime2.org/2020.11/tutorials/phylogeny/

开始本节分析前，我们假定你已经完成了前面内容的学习。

在QIIME 2中可用的几个下游多样性指标要求使用正在研究的操作分类单位（OTU）或精确序列变体（ESV，也叫扩增序列变体ASV）来构建系统树。

但是，我们如何从序列数据中构建系统发育？

好了，我们可以使用两种基于系统发育的方法。使用哪种决定，很大程度上取决于您的科学问题：

基于参考的片段插入方法(A reference-based fragment insertion approach)。这可能是理想的选择。特别是，如果您的参考系统发育史（和相关的代表性序列）包含您的序列可以被可靠地插入邻近的亲戚。不会插入与参考的匹配程度不高的任何序列。例如，如果您的数据包含在参考系统发育中未很好表示的序列（例如丢失的进化枝等），则此方法可能无法很好地工作。有关更多信息，请查看这些出色的片段插入示例。
从头开始。可以在不同分类单元中全局比对的标记基因通常适合通过这种方法进行序列比对和系统发育研究。在构建从头系统发育史时，请注意序列的长度，短读可能会导致缺乏足够的系统发育信息以捕获有意义的系统发育。本社区教程将重点介绍从头方法。

在这里，您将学习如何使用从头系统发育方法来：

在QIIME 2中生成多序列对齐文件
如果需要，遮罩对齐中的非保守区
构造系统发育树
确定系统发育树的根

如果您想通过使用QIIME 2外部的工具来替代此处概述的任何步骤，请在适当的地方查看9数据导入Importing data，10数据导出Exporting data和12数据筛选Filtering data文档。

序列对齐Sequence Alignment

在构建系统发育之前，我们必须生成多序列比对（multiple sequence alignment，MSA）。在构建MSA时，我们将通过其序列相似性来说明比对残基（MSA列）的推定同源性。

构建MSA的算法数量众多。我们将通过q2-alignment插件使用MAFFT（使用快速傅里叶变换的多重对齐）。有关更多信息，请查看MAFFT的文章。

首先，加载QIIME2环境，并创建一个工作目录：

conda activate qiime2-2020.11
mkdir -p phylogeny
cd phylogeny

下载代表序列

wget -c https://data.qiime2.org/2020.11/tutorials/phylogeny/rep-seqs.qza

运行MAFFT

qiime alignment mafft \
  --i-sequences rep-seqs.qza \
  --o-alignment aligned-rep-seqs.qza

输出对象：

rep-seqs.qza：预览 | 下载
aligned-rep-seqs.qza：预览 | 下载

减少对齐的歧义：屏蔽和参考对齐方式 Reducing alignment ambiguity: masking and reference alignments

为什么要屏蔽(mask)序列？

屏蔽/掩码有助于消除在系统发育分析之前系统发育上无用或误导的比对列。许多时间对准误差会引入噪声并混淆系统发育推断。在执行系统发生推断之前，通常会屏蔽（删除）这些歧义对齐的区域。特别是，David Lane（1991）的16S / 23S rRNA测序建议在系统发育分析之前屏蔽SSU数据。但是，知道如何处理歧义对齐的区域以及何时使用屏蔽很大程度上取决于要分析的标志物基因和数据需要回答的科学问题。

注意
请记住，这仍然是一个活跃的讨论领域，以下非详尽的文章清单突显了这一点：Wu等2012年，Ashkenazy等人2018年，Schloss 2010年，Tan等人2015年，Rajan2015年。

如何屏蔽序列呢？

为了我们的目的，我们假设在上面生成的MAFFT对齐方式中存在不确定的对齐列。屏蔽对齐默认设置--p-min-conservation接近QIIME 1的Lane mask。请密切注意对齐插件的更新。

qiime alignment mask \
  --i-alignment aligned-rep-seqs.qza \
  --o-masked-alignment masked-aligned-rep-seqs.qza

输出对象：

masked-aligned-rep-seqs.qza：预览 | 下载

基于参考的多序列比对(Reference based alignments)

有多种工具，例如PyNAST（使用NAST），Infernal和SINA等，它们试图通过使用校对的参考比对（例如SILVA）来减少歧义比对区域的数量。参考比对对rRNA基因特别有效序列数据，因为将二级结构的知识整合到了校对过程中，从而提高了比对质量。有关基于参考的比对方法更深入，更有说服力的概述，请查看SINA社区教程。

注意
就像上面的MAFFT示例一样，使用基于参考的对齐方式构造的对齐方式也可以被屏蔽。同样，我们在此处讨论的参考对齐方法与我们之前提到的参考系统发生方法（即q2-fragment-insertion）不同。也就是说，我们不是将数据插入到现有的树中，而只是试图创建更健壮的比对，以实现更好的从头系统发育。

构建系统发育 Construct a phylogeny

与MSA算法一样，系统发育推断工具也很丰富。幸运的是，有很多很棒的资源可以学习系统发育学。以下是一些入门资源，可帮助您入门：

qiime2：的 q2-phylogeny 插件中提供了几种方法/流程。这些基于以下工具：

方法Methods

fasttree

FastTree能够从大型序列比对中快速构建系统发育。它通过使用CAT-like的速率类别近似值来实现此目的，该近似值也可以通过RAxML获得（如下所述）。查阅FastTree在线手册以获取更多信息。

qiime phylogeny fasttree \
  --i-alignment masked-aligned-rep-seqs.qza \
  --o-tree fasttree-tree.qza

输出对象：

fasttree-tree.qza：预览 | 下载

小贴示：为了方便而直接地查看您的tree.qza文件，请将它们上传到iTOL。在这里，您可以交互地查看和操纵系统发育树。更好的是，在“正常模式”下查看树拓扑时，您可以将关联的alignment.qza（用于构建系统发育的那个）或相关的taxonomy.qza文件拖放到iTOL树可视化中。这将允许您直接查看序列比对或分类学以及系统发育。 🕶️
译者测试itol对QIIME 2的qza格式的支持情况和展示效果。
访问ttps://itol.embl.de/，注册账号登陆。上传树文件fasttree-tree.qza

拖拽aligned-rep-seqs.qza至树上展示

更多itol的使用，详见 - iTOL美化进阶

raxml

像fasttree一样，raxml将执行单个系统发育推断并返回一棵树。注意，raxml的默认模型是--p-substitution-model GTRGAMMA。如果您想使用像fasttree这样的CAT模型来构建树，只需将GTRGAMMA替换为GTRCAT，如下所示：

qiime phylogeny raxml \
  --i-alignment masked-aligned-rep-seqs.qza \
  --p-substitution-model GTRCAT \
  --o-tree raxml-cat-tree.qza \
  --verbose

正常是显示如下结果：

Running external command line application. This may print messages to stdout and/or stderr.
The command being run is below. This command cannot be manually re-run as it will depend on temporary files that no longer exist.

Command: raxmlHPC -m GTRCAT -p 6837 -N 1 -s /tmp/qiime2-archive-f7qd3egy/0f292022-14c0-431e-83ea-87e07fa04b35/data/aligned-dna-sequences.fasta -w /tmp/tmpscvv747b -n q2

Overall execution time: 2.139081 secs or 0.000594 hours or 0.000025 days

Saved Phylogeny[Unrooted] to: raxml-cat-tree.qza

也有时报错如下：可能是环境存在问题，我在Windows的Linux子系统20.04中运行正常，但在Ubuntu服务器16.04中报错如下：建议在哪里运行成功，就在哪里运行。

Plugin error from phylogeny:

  Command '['raxmlHPC', '-m', 'GTRCAT', '-p', '2629', '-N', '1', '-s', '/tmp/qiime2-archive-s7vy_amk/22897ab0-b865-46c7-b923-df59f38dd700/data/aligned-dna-sequences.fasta', '-w', '/tmp/tmpa1qe0e_q', '-n', 'q2']' returned non-zero exit status 255.

See above for debug info.

输出对象：

raxml-cat-tree.qza：预览 | 下载

详者注：如果分析中报错，可能是环境变量污染，可以退出环境。重新登陆termail，再加载qiime2环境重试。

使用raxml执行多次搜索 Perform multiple searches using raxml

如果您想对“树空间(tree space)”执行更彻底的搜索，则可以使用--pn-searches 5指示raxml对完全对齐执行多个独立搜索。一旦完成这5个独立搜索，则仅执行一次最佳搜索得分树将被返回。 请注意，我们不在这里进行自展支持率的计算，我们将在以后的示例中进行介绍。让我们设置--p-substitution-model GTRCAT。最后，我们还要通过--p-seed手动设置种子。通过设置我们的种子，我们允许其他用户可以重复出我们的系统发育树。也就是说，任何使用相同序列比对和替换模型的人，只要设置了相同的种子值，都将生成相同的树。尽管--p-seed不是必需的参数，但是设置此值通常是一个好主意。

qiime phylogeny raxml \
  --i-alignment masked-aligned-rep-seqs.qza \
  --p-substitution-model GTRCAT \
  --p-seed 1723 \
  --p-n-searches 5 \
  --o-tree raxml-cat-searches-tree.qza \
  --verbose

输出内容如下：

Running external command line application. This may print messages to stdout and/or stderr.
The command being run is below. This command cannot be manually re-run as it will depend on temporary files that no longer exist.

Command: raxmlHPC -m GTRCAT -p 1723 -N 5 -s /tmp/qiime2-archive-5mraa_k4/0f292022-14c0-431e-83ea-87e07fa04b35/data/aligned-dna-sequences.fasta -w /tmp/tmp9k6jpgh5 -n q2

Overall execution time: 6.214823 secs or 0.001726 hours or 0.000072 days

Saved Phylogeny[Unrooted] to: raxml-cat-searches-tree.qza

输出对象：

raxml-cat-searches-tree.qza：预览 | 下载

快速自展 raxml-rapid-bootstrap

在系统发育学中，优良作法是检查系统发育中的分开(splits)/分为两部分(bipartitions))受支持的程度。人们通常对进化史中哪些进化枝与其他进化枝牢固地分离感兴趣。一种方法是通过自展(bootstrapping)（请参见上面第一个介绍性链接的“自展”部分）。在QIIME 2中，我们提供了对RAxML快速自展功能。该命令与前一个命令的唯一区别是附加标志--p-bootstrap-replicates和--p-rapid-bootstrap-seed。执行100-1000个自展程序重复的任何位置都是很常见的。 --p-rapid-bootstrap-seed的工作原理与上面的--p-seed参数非常相似，不同之处在于，它允许任何人重现自展过程以及对分离的相关支持。

根据RAxML在线文档和RAxML手册，我们将在下面执行的快速自展命令将执行以下操作：

自展输入对齐方式100次，并对每一次执行最大似然（ML）搜索。
使用原始输入对齐方式，通过多次独立搜索找到最佳评分的ML树。独立搜索的数量由第一步中设置的引导复制数量决定。也就是说，随着引导复制的增加，您的搜索将变得更加彻底。
RAxML的ML优化使用每5个自展树作为原始树的ML搜索的起始树。

将两部分（自展支持率，第一步）映射到得分最高的ML树（第二步）上。

qiime phylogeny raxml-rapid-bootstrap \
  --i-alignment masked-aligned-rep-seqs.qza \
  --p-seed 1723 \
  --p-rapid-bootstrap-seed 9384 \
  --p-bootstrap-replicates 100 \
  --p-substitution-model GTRCAT \
  --o-tree raxml-cat-bootstrap-tree.qza \
  --verbose

显示如下结果：

Time for BS model parameter optimization 0.106221
Bootstrap[0]: Time 0.340991 seconds, bootstrap likelihood -1199.758796, best rearrangement setting 12
Bootstrap[1]: Time 0.221361 seconds, bootstrap likelihood -1344.229251, best rearrangement setting 6
...
Bootstrap[99]: Time 0.108568 seconds, bootstrap likelihood -1270.157811, best rearrangement setting 7
Saved Phylogeny[Unrooted] to: raxml-cat-bootstrap-tree.qza

输出对象：

raxml-cat-bootstrap-tree.qza：预览 | 下载

小贴示：优化RAxML运行时间。您可能已经注意到，我们尚未在RAxML方法中添加标志--p-raxml-version。该参数提供了一种访问RAxML版本的方法，该版本具有针对各种现代x86处理器体系结构进行了优化的矢量指令。摘自RAxML手册和帮助文档：首先，最新的处理器将支持SSE3矢量指令（即可能支持更快的AVX2矢量指令）。其次，这些指令将大大加速似然性和简约计算。通常，SSE3版本的运行速度比标准版本快40％。 AVX2版本的运行速度比SSE3版本快10-30％。此外，请记住，使用更多的内核/线程并不一定会减少运行时间。 RAxML手册建议每500个DNA比对模式使用1个核心。使用--verbose选项时，对齐模式信息通常在屏幕上可见。另外，尝试使用速率类别（CAT模型；通过--p-substitution-model），其结果与GAMMA模型一样好，并且速度快了大约4倍。请参阅CAT论文。 CAT近似也非常适合包含10,000个或更多类群的比对，并且与FastTree2的类似CAT的模型非常相似。

iqtree

与上面的raxml和raxml-rapid-bootstrap方法类似，我们为IQ-TREE提供了类似的功能：iqtree和iqtree-ultrafast-bootstrap。与fastree和raxml选项相比，IQ-TREE的独特之处在于它可以访问286个核苷酸取代模型。 IQ-TREE还可以通过其内置的ModelFinder算法在构建树之前确定其中哪个模型最适合您的数据集。这是QIIME 2中的默认设置，但请放心，您可以通过—p-substitution-model标志设置286个核苷酸替换模型中的任何一个，例如您可以将模型设置为HKY+I+G，而不是默认的MFP（基本的简写：“在确定由ModelFinder确定的最佳拟合模型后建立系统发育”）。请记住，通过ModelFinder进行模型测试所需的额外计算时间。

使用默认设置和自动模型选择（MFP）运行iqtree命令的最简单方法如下：

qiime phylogeny iqtree \
  --i-alignment masked-aligned-rep-seqs.qza \
  --o-tree iqt-tree.qza \
  --verbose

显示如下结果：

Running external command line application. This may print messages to stdout and/or stderr.
The command being run is below. This command cannot be manually re-run as it will depend on temporary files that no longer exist.

Command: iqtree -st DNA --runs 1 -s /tmp/qiime2-archive-5pz537ii/0f292022-14c0-431e-83ea-87e07fa04b35/data/aligned-dna-sequences.fasta -m MFP -pre /tmp/tmpio8g5og8/q2iqtree -nt 1

Date and Time: Thu May 14 16:59:42 2020
Saved Phylogeny[Unrooted] to: iqt-tree.qza

输出对象：

iqt-tree.qza：预览 | 下载

指定替代模型Specifying a substitution model

我们还可以设置我们选择的替代模型。您可能在观看上一个命令的屏幕输出时注意到，已注意到ModelFinder选择的最佳拟合模型。为了争辩起见，假设最佳选择的模型显示为GTR+F+I+G4。 F仅是一种表示法，它使我们知道，如果给定模型支持不相等的基频，则默认情况下将使用经验基频。使用经验基础频率（F）而不是估计它们，可以大大减少计算时间。 iqtree插件在命令行提供的模型符号内将不接受F，因为对于适当的模型，这始终会自动隐含。另外，iqtree插件仅接受在模型符号中指定的G而不是G4。 4只是另一个明确的表示法，以提醒我们默认情况下采用四个比率类别。在命令行上提供模型符号时，插件使用的符号方法仅有助于保持简单性和熟悉性。因此，简单来说，我们只需要输入GTR+I+G作为我们的输入模型：

qiime phylogeny iqtree \
  --i-alignment masked-aligned-rep-seqs.qza \
  --p-substitution-model 'GTR+I+G' \
  --o-tree iqt-gtrig-tree.qza \
  --verbose

显示结果同上面类似，省略重复部分。

Date and Time: Thu May 14 17:04:04 2020
Saved Phylogeny[Unrooted] to: iqt-gtrig-tree.qza

输出对象：

iqt-gtrig-tree.qza：预览 | 下载

让我们重新运行上面的命令并添加--p-fast选项。此选项仅与iqtree方法兼容，类似于fasttree执行的快速搜索。 🏎️其次，我们还要执行多个树搜索，并保持其中的最好树（就像我们之前使用raxml --p-n-searches ...命令所做的那样）：

qiime phylogeny iqtree \
  --i-alignment masked-aligned-rep-seqs.qza \
  --p-substitution-model 'GTR+I+G' \
  --p-fast \
  --p-n-runs 10 \
  --o-tree iqt-gtrig-fast-ms-tree.qza \
  --verbose

显示结果同上面类似，省略重复部分。

Date and Time: Thu May 14 17:15:01 2020
Saved Phylogeny[Unrooted] to: iqt-gtrig-fast-ms-tree.qza

输出对象：

iqt-gtrig-fast-ms-tree.qza：预览 | 下载

单枝检验 Single branch tests

IQ-TREE提供一些单枝检验的方法

SH-aLRT：--p-alrt [INT >= 1000]
aBayes: --p-abayes [TRUE | FALSE]
local bootstrap test: --p-lbp [INT >= 1000]

单分支检验通常被用作我们上面讨论过的自展方法的替代方法，因为它们的速度要快得多，并且在构建大型系统发育树（例如，> 10,000个类群）时经常被推荐使用。这三种方法均可同时应用，并在iTOL中视为独立的自展支持率。这些值始终按alrt / lbp / abayes的以下顺序列出。我们将继续并在下一个命令中应用所有分支检验，同时指定与上述相同的替代模型。随时将其与--p-fast选项结合使用。 😉

qiime phylogeny iqtree \
  --i-alignment masked-aligned-rep-seqs.qza \
  --p-alrt 1000 \
  --p-abayes \
  --p-lbp 1000 \
  --p-substitution-model 'GTR+I+G' \
  --o-tree iqt-sbt-tree.qza \
  --verbose

输出对象：

iqt-sbt-tree.qza：预览 | 下载

小贴士：IQ-TREE搜索设置。 iqtree有很多可调整的参数，可以对其进行修改，以改善通过“树空间”的搜索，并防止搜索算法陷入局部最优状态。在这方面有帮助的一种最佳实践是调整以下参数：--p-perturb-nni-strength和--p-stop-iter（每个参数分别映射到iqtree的-pers和-nstop标志）。简而言之，NNI（nearest-neighbor interchange, 最近邻居交换）扰动的值越大，“树空间”中的跳跃就越大。该值应设置得足够高，以允许搜索算法避免陷入局部最优状态，但又不能设置得太高，以免搜索偶然在“树空间”中跳跃。也就是说，像Goldilocks和三个🐻，您需要找到一个“恰好”的设置，或者至少在一个合理的范围内。一种评估方法是使用--verbose标志进行一些短期试用。如果您看到似然值跳得很大，则可以降低--p-perturb-nni-strength的值。至于停止标准，即--p-stop-iter，此值越高，您在“树空间”中的搜索就越彻底。请注意，增加此值也可能会增加运行时间。也就是说，搜索将继续进行，直到采样了许多树（例如100（默认）），而没有找到更好的评分树。如果找到更好的树，则计数器重置，然后继续搜索。当给定的数据集包含许多短序列（对于微生物组调查数据非常普遍）时，这两个参数值得特别考虑。我们可以对原始命令进行修改，以包含这些额外的参数，并建议对短序列进行修改，例如，较低的扰动强度值（较短的读取不包含太多的系统发育信息，因此，我们应限制在“树空间”中跳转的距离”）和更多的停止迭代。有关默认参数设置的更多详细信息，请参见IQ-TREE命令参考。最后，我们将让iqtree执行模型测试，并自动确定要使用的CPU核心的最佳数量。

qiime phylogeny iqtree \
  --i-alignment masked-aligned-rep-seqs.qza \
  --p-perturb-nni-strength 0.2 \
  --p-stop-iter 200 \
  --p-n-cores 1 \
  --o-tree iqt-nnisi-fast-tree.qza \
  --verbose

输出对象：

iqt-nnisi-fast-tree.qza：预览 | 下载

iqtree-ultrafast-bootstrap

根据我们在上面的raxml-rapid-bootstrap部分中的讨论，我们还可以使用IQ-TREE来评估通过超快速自展算法在系统进化系统中对拆分/划分的支持程度。下面，我们将应用插件的ultrafast bootstrap命令：自动模型选择（MFP），执行1000次迭代自展（最低要求），设置相同的建议参数以从短序列构建系统发育，并自动确定最佳CPU使用数量：

qiime phylogeny iqtree-ultrafast-bootstrap \
  --i-alignment masked-aligned-rep-seqs.qza \
  --p-perturb-nni-strength 0.2 \
  --p-stop-iter 200 \
  --p-n-cores 1 \
  --o-tree iqt-nnisi-bootstrap-tree.qza \
  --verbose

输出对象：

iqt-nnisi-bootstrap-tree.qza：预览 | 下载

与ufboot一起执行单分支检验 Perform single branch tests alongside ufboot

我们还可以将单分支检验方法与超快速自展同时应用。支持值将始终按以下顺序表示：alrt / lbp / abayes / ufboot。同样，这些值可以视为iTOL中单独列出的自展支持率。我们还将像之前一样指定一个模型。

qiime phylogeny iqtree-ultrafast-bootstrap \
  --i-alignment masked-aligned-rep-seqs.qza \
  --p-perturb-nni-strength 0.2 \
  --p-stop-iter 200 \
  --p-n-cores 1 \
  --p-alrt 1000 \
  --p-abayes \
  --p-lbp 1000 \
  --p-substitution-model 'GTR+I+G' \
  --o-tree iqt-nnisi-bootstrap-sbt-gtrig-tree.qza \
  --verbose

输出对象：

iqt-nnisi-bootstrap-sbt-gtrig-tree.qza：预览 | 下载

小贴士：如果需要减少在UFBoot搜索过程中发生的潜在模型违规的影响，并且/或者只是想更加严格，我们可以在任何iqtree-ultrafast-bootstrap中添加--p-bnni选项。

确定树的根 Root the phylogeny

为了正确使用UniFrac等多样性指标，系统发育必须确定根。通常，在生根树时选择外组。通常，默认情况下，使用最大似然性的系统发育推断工具通常会返回无根的树。

QIIME 2为中点根为我们的系统发育提供了一种方法。将来可能会提供其他定根选项。现在，我们将从iqtree-ultrafast-bootstrap确定我们自展树的根，如下所示：

qiime phylogeny midpoint-root \
  --i-tree iqt-nnisi-bootstrap-sbt-gtrig-tree.qza \
  --o-rooted-tree iqt-nnisi-bootstrap-sbt-gtrig-tree-rooted.qza

输出对象：

iqt-nnisi-bootstrap-sbt-gtrig-tree-rooted.qza：预览 | 下载

小贴士：iTOL查看提醒。我们可以通过iTOL查看我们的树及其关联的对齐方式。您需要做的就是上传iqt-nnisi-bootstrap-sbt-gtrig-tree-rooted.qza树文件。在普通模式下显示树。然后将masked-aligned-rep-seqs.qza文件拖放到可视化文件上。现在，您可以查看比对旁边的系统发育。

流程 Pipelines

在这里，我们将概述系统发育流程：align-to-tree-mafft-fasttree

流程的一个优点是，它们将常用命令的有序集合组合为一个压缩的简单命令。为了使这些“便利”管道易于使用，通常只向用户公开一些选项。也就是说，通过管道执行的大多数命令通常都配置为使用默认选项设置。但是，提供了对于用户来说考虑设置非常重要的选项。通过给定流程公开的选项在很大程度上取决于它在做什么。流程也是新用户入门的好方法，因为它有助于为建立标准操作程序奠定良好实践的基础。

而不是运行下面列出的一个或多个以下QIIME 2命令：

qiime alignment mafft ...
qiime alignment mask ...
qiime phylogeny fasttree ...
qiime phylogeny midpoint-root ...

我们可以利用流程align-tree-mafft-fasttree一次性完成上述四个步骤。这是从流程帮助文档中获得的描述：

该流程将从使用MAFFT创建序列比对开始，此后，系统上无信息或歧义比对的所有比对列都将被删除（屏蔽）。产生的屏蔽对齐将用于推断系统发育树，然后在其中点确定根。流程每个步骤的输出文件将被保存。这包括来自q2-alignment方法的未屏蔽和已屏蔽的MAFFT对齐方式，以及来自q2-phylogeny方法的有根和无根系统发育。

只需运行以下命令即可完成所有操作：

qiime phylogeny align-to-tree-mafft-fasttree \
  --i-sequences rep-seqs.qza \
  --output-dir mafft-fasttree-output

输出对象：

mafft-fasttree-output/masked_alignment.qza：预览 | 下载
mafft-fasttree-output/rooted_tree.qza：预览 | 下载
mafft-fasttree-output/alignment.qza：预览 | 下载
mafft-fasttree-output/tree.qza：预览 | 下载

恭喜你！您现在知道了如何在QIIME 2中构建系统发育树啦！

译者简介

刘永鑫，博士，中科院青促会会员，QIIME 2项目参与人。2008年毕业于东北农业大学微生物学专业，2014年于中国科学院大学获生物信息学博士，2016年遗传学博士后出站留所工作，任工程师。目前主要研究方向为宏基因组数据分析。目前在Science、Nature Biotechnology、Protein & Cell、Current Opinion in Microbiology等杂志发表论文30余篇，被引2千余次。2017年7月创办“宏基因组”公众号，目前分享宏基因组、扩增子原创文章2400余篇，代表作有《扩增子图表解读、分析流程和统计绘图三部曲(21篇)》、《微生物组实验手册》、《微生物组数据分析》等，关注人数11万+，累计阅读2100万+。

Reference

https://docs.qiime2.org/2020.11

Evan Bolyen, Jai Ram Rideout, Matthew R. Dillon, Nicholas A. Bokulich, Christian C. Abnet, Gabriel A. Al-Ghalith, Harriet Alexander, Eric J. Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E. Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J. Brislawn, C. Titus Brown, Benjamin J. Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily K. Cope, Ricardo Da Silva, Christian Diener, Pieter C. Dorrestein, Gavin M. Douglas, Daniel M. Durall, Claire Duvallet, Christian F. Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M. Gauglitz, Sean M. Gibbons, Deanna L. Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin A. Huttley, Stefan Janssen, Alan K. Jarmusch, Lingjing Jiang, Benjamin D. Kaehler, Kyo Bin Kang, Christopher R. Keefe, Paul Keim, Scott T. Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan G. I. Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D. Martin, Daniel McDonald, Lauren J. McIver, Alexey V. Melnik, Jessica L. Metcalf, Sydney C. Morgan, Jamie T. Morton, Ahmad Turan Naimey, Jose A. Navas-Molina, Louis Felix Nothias, Stephanie B. Orchanian, Talima Pearson, Samuel L. Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S. Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R. Spear, Austin D. Swafford, Luke R. Thompson, Pedro J. Torres, Pauline Trinh, Anupriya Tripathi, Peter J. Turnbaugh, Sabah Ul-Hasan, Justin J. J. van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C. Weber, Charles H. D. Williamson, Amy D. Willis, Zhenjiang Zech Xu, Jesse R. Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight & J. Gregory Caporaso#. Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. Nature Biotechnology. 2019, 37: 852-857. doi:10.1038/s41587-019-0209-9

转载本文请联系原作者获取授权，同时请注明本文来自刘永鑫科学网博客。
链接地址：https://m.sciencenet.cn/blog-3334560-1270468.html

上一篇：QIIME 2教程. 20实用程序Utilities(2020.11)
下一篇：QIIME 2教程. 22命令行界面q2cli(2020.11)

woodcorpse的个人博客分享 http://blog.sciencenet.cn/u/woodcorpse

博文

QIIME 2教程. 21进化树推断q2-phylogeny(2020.11)

使用q2-phylogeny进行系统发育推断

序列对齐Sequence Alignment

减少对齐的歧义：屏蔽和参考对齐方式 Reducing alignment ambiguity: masking and reference alignments

构建系统发育 Construct a phylogeny

方法Methods

fasttree

raxml

使用raxml执行多次搜索 Perform multiple searches using raxml

快速自展 raxml-rapid-bootstrap

iqtree

指定替代模型Specifying a substitution model

单枝检验 Single branch tests

iqtree-ultrafast-bootstrap

与ufboot一起执行单分支检验 Perform single branch tests alongside ufboot

确定树的根 Root the phylogeny

流程 Pipelines

译者简介

Reference

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

刘永鑫

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

woodcorpse的个人博客分享 http://blog.sciencenet.cn/u/woodcorpse

博文

QIIME 2教程. 21进化树推断q2-phylogeny(2020.11)

使用q2-phylogeny进行系统发育推断

序列对齐Sequence Alignment

减少对齐的歧义：屏蔽和参考对齐方式 Reducing alignment ambiguity: masking and reference alignments

构建系统发育 Construct a phylogeny

方法Methods

fasttree

raxml

使用raxml执行多次搜索 Perform multiple searches using raxml

快速自展 raxml-rapid-bootstrap

iqtree

指定替代模型Specifying a substitution model

单枝检验 Single branch tests

iqtree-ultrafast-bootstrap

与ufboot一起执行单分支检验 Perform single branch tests alongside ufboot

确定树的根 Root the phylogeny

流程 Pipelines

译者简介

Reference

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

刘永鑫

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

该博文允许注册用户评论请点击登录评论 (0 个评论)