zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

ScRNAPip:单细胞RNA数据分析管道

已有 875 次阅读 2023-9-26 18:07 |个人分类:科普|系统分类:科普集锦

ScRNAPip:单细胞RNA数据分析管道 

单细胞测序技术是指在单细胞水平上对基因组、转录组和表观基因组进行高通量测序分析的新技术。它可以揭示单个细胞的基因结构和基因表达状态,反映细胞间的异质性。单细胞组学技术由于其高通用性,在癌症、微生物学和神经科学等领域发挥着重要作用。通过单细胞RNA测序(scRNA-seq)获得的大量新信息可能会重塑我们对疾病中基因调控和细胞异质性的理解。 

目前,已有超过1500种工具被开发用于scRNA-seq数据分析,涉及30多个类别(https://www.scrna-tools.org/)。这可能是一个巨大的挑战,为研究人员选择合适的工具进行数据分析。在这项研究中,ScRNAPip的目标是建立一个系统的、动态的、可重复的工作流程,并指导用户完成scRNA-seq分析的关键步骤,包括数据过滤、均质化、降维分析、差异分析、伪时间分析、单细胞浏览器、circos图、拷贝数变异(CNV)和基因组不稳定性。这种可重复的分析管道也可以是一个易于修改的配置文件,以合并不同的数据源,并将作为模板来分析和可视化其他疾病模型中的单细胞数据集。此外,考虑到程序运行了很长时间后出现意外崩溃的可能性,在进程中设置了一个可重新启动的断点。 

一些单细胞分析工作流程已经开发出来,如scAmpi https://github.com/ ETH-NEXUS/scAmpi_single_cell_RNAscTyper (https://github.com/omicsCore/scTyper)。与这些工作流相比,ScRNAPip的工作流包含了更多的分析模块。对于scTyper(1)它不包括伪时间分析、细胞通讯和功能分析;(2)不具备批量校正功能;(3)可视化效果较少。对于scAmpi(1)它不包括肿瘤细胞鉴定、细胞通讯和伪时间分析。ScRNAPip的缺点是:(1)局部分析只支持使用一个软件进行分析;(2)对人、鼠以外物种的适用性较弱。 

ScRNAPip工作流基于RPython,并使用fastp (V0.23.2) CellRanger (V7.1.0) Seurat (V4.3.0) Monocle2 (V2.26.0)等软件。ScRNAPip不支持质量控制,从其他平台读取数据映射。但是,如果有可用的表达式矩阵,则可以输入它(按照10X表达式矩阵的格式)以用于其他分析点。 

ScRNAPip管道(图1)目前既支持人类也支持小鼠。如果要分析其他物种,可按照步骤进行操作,在配置文件中的位置中选择一个物种,然后在配置文件中选择一个物种。(1)NCBIEnsembl下载参考基因组的fagtf文件。请注意,从NCBI下载的注释文件通常是gff格式,需要使用gffread将其转换为gtf格式。(2)CellRanger中使用mkref命令构建参考基因组。命令为“CellRanger mkref –genome = genomename –fasta = genome.fa –genes = genome.gtf.”。以上构建的参考基因组可用于CellRanger分析以生成表达矩阵。在随后的高级分析中,可以直接运行细胞相互作用的步骤1-6和步骤8,而无需进行任何更改。步骤7用于拷贝数分析,步骤9用于基因组不稳定性分析,步骤10用于伪时间分析,仅支持人类和小鼠。富集分析的第11步需要更改数据库。 

image.png  

1 ScRNAPip流程 

ScRNAPip可以从https://github.com/OpenGene/scrnapip中获取。 

参考文献

[1] Xu, Limin, Zhang, Jing, He, Yiqian, Yang, Qianqian, Mu, Tianhao, Guo, Qiushi, Li, Yingqiang, Tong, Tian, Chen, Shifu, and Ye, Richard D.. 2023. “ ScRNAPip: A Systematic and Dynamic Pipeline for Single-Cell RNA Sequencing Analysis.” iMeta e132. https://doi.org/10.1002/imt2.132 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

image.png




https://m.sciencenet.cn/blog-571917-1403932.html

上一篇:HMDD 4.0:miRNA-疾病实验验证关系数据库
下一篇:Dictys:动态基因调控网络剖析发育连续体

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-20 12:09

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部