据悉,HRA工作组与将与跨20多个国际项目合作,通过详细讨论制定了有助于HRA构建、使用和可持续性的三个关键目标,即①将新组织与现有数据进行匹配;②包含能够洞察发生在身体各个层面的变化的功能(如衰老、疾病或其他扰动);③采用能够鼓励协作并指导未来发展的流程,如利用具有模块化、轻量级组件的架构等。此外,对于图谱构建和使用的关键SOP以及HRA术语也达成一致。
在2023年12月发布的第六版HRA v2.0(图1)中,包含4,499种独特解剖结构、1,195种细胞类型和2,089种生物标志物(如基因、蛋白质和脂质),这些数据来自33个ASCT+B表和65个与本体相关联的3D参考对象。图1. HRA组成部分及关联为构建复杂而精细的HRA图谱,研究团队运用了多种关键技术方法。首先收集来自不同个体的组织样本,包括多种器官的组织块,并通过三种方式对样本进行数据整合,使用Azimuth进行单细胞注释,通过器官定位抗体panel(OMAP)实现空间蛋白质组定位,注册用户界面(RUI)完成组织样本3D空间注册。
在数据扩展方面,研究团队扩展了Uberon解剖本体(ontologie)和Cell Ontology细胞本体,新增125个解剖术语和141个细胞类型。通过HRAlit数据库将700万篇文献、58万学者信息与图谱数据相关联,HRApop整合了553个组织数据集,用于计算具有3D参考对象的40个解剖结构的细胞类型。
研究团队还开发了灵活的混合云架构,以支持数据的管理、分析和访问。该架构整合了50多个开源算法,实现了数据的半自动提取、自动分析注释、可查找性、可访问性、互操作性、分析支持和可持续性。在这个架构下,数据和代码通过HuBMAP数据门户和HRA门户提供服务,方便研究人员使用。
此外,研究团队开发了统一的数据处理流程,涵盖多种数据类型的处理。例如,针对单细胞(sc)/ 单细胞核(sn)RNA 测序数据,基于Salmon准映射方法构建了处理流程,并使用Scanpy和scVelo进行下游分析和RNA速度计算。对于成像数据,使用端到端的分析方法,包括图像校正、细胞和细胞核分割等步骤,并通过空间过程和关系建模(SPRM)计算相关指标。
--
FROM 59.41.66.*