https://mp.weixin.qq.com/s/EAJpBOUjNrlHAjbpPW394w近日,中国农业科学院刘永鑫组联合南京农业大学袁军组在国际期刊 Protein & Cell (IF = 21.1) 发表了题为”“The best practice for microbiome analysis using R”的综述论文,建立了微生物组分析的R语言代码库EasyMicrobiomeR,助力微生物组学发展。
IF: 21.1 上线时间: 2023/05/02
DOI:
https://doi.org/10.1093/procel/pwad024第一作者:文涛(Tao Wen),牛国庆(Guoqing Niu)
通讯作者:袁军(Jun Yuan, junyuan@njau.edu.cn)、刘永鑫(Yong-Xin Liu, liuyongxin@caas.cn)
合作作者:陈同( Tong Chen),沈其荣(Qirong Shen)(shenqirong@njau.edu.cn)
图文摘要
本文详细介绍了基于R语言的324个常用R包进行微生物组数据挖掘的过程。特别关注了六个微生物组分析集成R包(phyloseq, microbiome, MicrobiomeAnalystR, Animalcules, microeco, amplicon)。并提出了基于R语言进行微生物组分析的最佳流程,相关代码都可以在
https://github.com/taowenmicro/EasyMicrobiomeR 获取。如果觉得项目有用,欢迎点击GitHub主页右上角Star支持本项目。
摘要
随着测序技术的逐步成熟,许多微生物组研究成果相继发表,推动了相关分析工具的出现和发展。R语言是目前广泛使用的用于微生物数据分析的平台,具有强大的功能。然而,数以万计的R包和无数类似的分析工具给许多研究人员挖掘微生物组数据带来了重大挑战。如何从众多的R包中选择合适、高效、方便、易学的工具已经成为许多微生物组研究人员面临的问题。我们整理了324个用于微生物组分析的常用R包,并根据应用类别(多样性、差异性、生物标志物、相关性和网络、功能预测等)对其进行分类,以帮助研究人员快速找到用于微生物组分析的相关R包。此外,我们对微生物组分析的集成R包(Phyloseq、Microbiome、MicrobiomeAnalystR、Animalcules、Microeco和Amplicon)进行了系统的分类,并总结了它们的优点和局限性,以帮助研究人员选择合适的工具。最后,我们对用于微生物组分析的R包进行了全面的回顾,总结了微生物组中大多数常见的分析内容,构建最适合微生物组分析的流程。本文附带了GitHub中数百个代码的例子,可以帮助初学者学习,也可以帮助分析人员比较和测试不同的工具。本文对R在微生物组中的应用进行了系统的梳理,为今后开发更好的微生物组工具提供了重要的理论依据和实践参考。所有代码都可以在GiHub:
https://github.com/taowenmicro/EasyMicrobiomeR 上找到。
文章亮点
本文按照六大功能类别(多样性、差异性、生物标志物、相关性和网络、功能预测和其他分析)对324个常用R包进行功能分类;
对微生物组分析的集成R包(phyloseq, microbiome, MicrobiomeAnalystR, Animalcules, microeco, and amplicon)进行了系统的介绍,并总结了其优点和局限性;
本文总结了微生物组数据分析中常见的内容,并提供了一套最适合微生物组数据挖掘的分析流程;
在GitHub上,分享了包含上万行代码的例子,这些例子不仅可以帮助初学者学习,还可以帮助专业人员比较和测试不同的工具。
引言
杨盛蝶翻译,南京农业大学,博士在读;
宏基因组分析通过对微生物群落的DNA或RNA序列进行测序、定量、注释和分析,来研究微生物的多样性、结构和功能。微生物组研究中常用的高通量测序技术主要有扩增子测序(amplicon sequencing)和随机宏基因组测序(shotgun metagenomic sequencing)。扩增子测序以其成本低、分析体系成熟、分析过程简单等优点被广泛应用于微生物组研究中。随机宏基因组测序提供了微生物的功能信息和更准确的微生物组成信息,测序成本较高,所需计算资源较大。我们在之前的综述中系统地总结了这两种测序的详细流程(刘永鑫等,2021年,Protein & Cell)。微生物群落作为生物多样性的重要组成部分,在生物学、生态学、生物技术、农业和医学等领域发挥着至关重要的作用。微生物群落分析需要多种生物信息学方法,主要包括三个部分:1)数据预处理,2)量化和注释,3)统计和可视化(图1A)。在预处理阶段,对原始数据进行过滤和质量控制,以确保数据质量。在量化和注释步骤中,使用工具和数据库来识别微生物代表序列并注释微生物分类和功能。微生物群落分析的前两部分已经进行了很好的讨论,根据我们之前的论文(刘永鑫等,2023,iMeta)可以很好地完成这两部分。最后,在统计和可视化步骤中,使用各种统计方法来探索微生物群落的多样性、结构和潜在功能。
--
FROM 59.41.66.*