小柯机器人

科学家使用uDance策略生成准确且可扩展的系统发育树
2023-07-30 22:12

美国加州大学Siavash Mirarab团队近期取得重要工作进展。他们使用uDance策略生成了准确且可扩展的系统发育树。相关研究成果2023年7月27日在线发表于《自然—生物技术》杂志上。

据介绍,系统发育树为组织整个生命树的演化史提供了一个框架,并有助于下游的比较分析,如宏基因组鉴定。依赖16S rRNA等单标记基因的方法在数十万个生物体中产生了精度有限的发育树,而使用全基因组数据的方法无法扩展到大量基因组。

研究人员介绍了uDance更新树,这是一种使用分治策略实现可更新的全基因组推理的方法,该策略独立地细化树的不同部分,并且可以在现有树的基础上构建,具有高精度和可扩展性。通过uDance方法,研究人员使用387个标记基因(总共425亿个氨基酸残基)推断出一个约有20万个基因组的物种树。

附:英文原文

Title: Generation of accurate, expandable phylogenomic trees with uDance

Author: Balaban, Metin, Jiang, Yueyu, Zhu, Qiyun, McDonald, Daniel, Knight, Rob, Mirarab, Siavash

Issue&Volume: 2023-07-27

Abstract: Phylogenetic trees provide a framework for organizing evolutionary histories across the tree of life and aid downstream comparative analyses such as metagenomic identification. Methods that rely on single-marker genes such as 16S rRNA have produced trees of limited accuracy with hundreds of thousands of organisms, whereas methods that use genome-wide data are not scalable to large numbers of genomes. We introduce updating trees using divide-and-conquer (uDance), a method that enables updatable genome-wide inference using a divide-and-conquer strategy that refines different parts of the tree independently and can build off of existing trees, with high accuracy and scalability. With uDance, we infer a species tree of roughly 200,000 genomes using 387 marker genes, totaling 42.5 billion amino acid residues.

DOI: 10.1038/s41587-023-01868-8

Source: https://www.nature.com/articles/s41587-023-01868-8

Nature Biotechnology:《自然—生物技术》,创刊于1996年。隶属于施普林格·自然出版集团,最新IF:68.164
官方网址:https://www.nature.com/nbt/
投稿链接:https://mts-nbt.nature.com/cgi-bin/main.plex


本期文章:《自然—生物技术》:Online/在线发表

分享到:

0