小柯机器人

单细胞RNA测序数据聚类的显著性分析
2023-07-13 14:43

美国丹娜-法伯癌症研究所Rafael A. Irizarry,美国南加州大学Kelly Street和美国哈佛大学公共卫生学院Isabella N. Grabski共同合作,近期取得重要工作进展。他们进行了单细胞RNA测序数据聚类的显著性分析研究。相关工作成果2023年7月10日在线发表于《自然—方法学》杂志上。

据介绍,单细胞RNA测序数据的无监督聚类能够识别不同的细胞群体。然而,最广泛使用的聚类算法是启发式的,并且没有正式考虑统计不确定性。

研究人员发现,如果不以统计上严格的方式解决已知的变异源,可能会导致对新细胞类型的发现过于自信。

研究人员扩展了以前的方法(即层次聚类的显著性),提出了一种基于模型的假设检验方法,该方法将显著性分析纳入聚类算法,并允许将聚类作为不同的细胞群体进行统计评估。研究人员还调整了这种方法,以允许对任何算法报告的聚类进行统计评估,并进一步将这些方法扩展到考虑批处理结构。研究人员将这一方法与流行的集群工作流进行了基准测试,展示了改进的性能。

总之,这一方法成功应用于人类肺细胞图谱和小鼠小脑皮层图谱,确定了几个过度聚类的案例,并重述了实验验证的细胞类型定义。

附:英文原文

Title: Significance analysis for clustering with single-cell RNA-sequencing data

Author: Grabski, Isabella N., Street, Kelly, Irizarry, Rafael A.

Issue&Volume: 2023-07-10

Abstract: Unsupervised clustering of single-cell RNA-sequencing data enables the identification of distinct cell populations. However, the most widely used clustering algorithms are heuristic and do not formally account for statistical uncertainty. We find that not addressing known sources of variability in a statistically rigorous manner can lead to overconfidence in the discovery of novel cell types. Here we extend a previous method, significance of hierarchical clustering, to propose a model-based hypothesis testing approach that incorporates significance analysis into the clustering algorithm and permits statistical evaluation of clusters as distinct cell populations. We also adapt this approach to permit statistical assessment on the clusters reported by any algorithm. Finally, we extend these approaches to account for batch structure. We benchmarked our approach against popular clustering workflows, demonstrating improved performance. To show practical utility, we applied our approach to the Human Lung Cell Atlas and an atlas of the mouse cerebellar cortex, identifying several cases of over-clustering and recapitulating experimentally validated cell type definitions.

DOI: 10.1038/s41592-023-01933-9

Source: https://www.nature.com/articles/s41592-023-01933-9

Nature Methods:《自然—方法学》,创刊于2004年。隶属于施普林格·自然出版集团,最新IF:47.99
官方网址:https://www.nature.com/nmeth/
投稿链接:https://mts-nmeth.nature.com/cgi-bin/main.plex


本期文章:《自然—方法学》:Online/在线发表

分享到:

0