您的位置:首页 >生活 >

空间生物学的通用框架

导读 生物过程由其发生的环境决定。海德堡欧洲分子生物学实验室 (EMBL) 的 Stegle 小组和德国癌症研究中心 (DKFZ) 开发的一种新工具通过整...

生物过程由其发生的环境决定。海德堡欧洲分子生物学实验室 (EMBL) 的 Stegle 小组和德国癌症研究中心 (DKFZ) 开发的一种新工具通过整合不同形式的空间数据,有助于将分子生物学研究成果置于更好的细胞环境背景中。

在组织中,每个细胞都被其他细胞包围,它们不断相互作用,产生生物功能。要了解组织在癌症等疾病中如何运作或失灵,不仅要了解每个细胞的特征,还要考虑它们的空间环境。在细胞所处的物理空间背景下定量表征细胞是理解复杂系统的关键。

支持此类探索的技术被称为空间组学技术,其不断发展促进了空间生物学的普及。此类技术可以提供有关单个细胞的分子组成及其空间排列的详细信息。然而,这些技术侧重于细胞的不同特征 - 例如 RNA 或蛋白质水平,并且生成的数据集以不同的方式管理和存储。为了解决这一挑战,由 Stegle Group 领导的合作项目开发了 SpatialData,这是一种数据标准和软件框架,允许科学家以统一的方式表示来自各种空间组学技术的数据。

空间生物学技术开发

在过去十年中,学术界和工业界开发了许多技术,用于空间可视化组织、细胞和亚细胞区室。然而,每种技术都只关注少数理想特征,并存在相关的权衡。例如,10x Genomics 的 Visium 可以捕获有关组织中所有基因表达的信息,但不提供单细胞分辨率。相比之下,10x Genomics Xenium 检测、MERFISH 或 Vizgen 的 MERSCOPE 平台可以生成具有亚细胞分辨率的细粒度基因表达图。然而,这些检测目前仅限于几百个预选基因。此类技术的数量不断增加,每种技术都只提供全貌的一小部分。

空间组学技术的挑战

这种技术的异构性在计算方面表现为文件格式的更大异构性:每种技术都有自己的存储格式,并且由同一种技术生成的数据通常可以以多种格式存储。

实际上,这给空间组学数据分析带来了诸多挑战。可视化和分析方法通常针对特定技术量身定制,这限制了数据兼容性,并且很难将不同的方法集成到单个分析流程中。然而,为了全面了解生物系统,同时观察不同位置的不同细胞特征或样本非常重要。组学技术会产生大量数据(数 TB 的图像、数百万个细胞、数十亿个单分子),需要优化的工程解决方案。因此,空间生物学迫切需要一个通用框架,可以跨实验和技术整合数据,并提供对健康和疾病的整体见解。这就是 SpatialData 发挥作用的地方。

SpatialData - 一个统一它们的框架

“迫切需要建立用于管理和存储空间组学数据的社区解决方案。特别是,需要开发新的数据标准和计算基础,以便统一各种新兴空间组学技术的分析方法,” EMBL基因组生物学部门组长、德国癌症研究中心 (DKFZ)计算基因组学和系统遗传学部门负责人Oliver Stegle 表示。“朝这个方向迈出的第一步是 SpatialData,这是一种数据标准和软件框架,它将以前的单细胞多组学数据管理概念与空间领域联系起来并加以调整。”

SpatialData 统一并整合了来自不同组学技术的数据,将最先进的技术与允许以高性能计算方式访问和操作数据的框架连接起来。该工具是在最近的《Nature Methods》出版物中介绍的,由 Luca Marconato 在 EMBL Stegle 集团攻读博士学位期间撰写,该集团与海德堡大学生物科学学院联合授予学位。“我们开发了 SpatialData 框架来缓解研究空间生物学时的数据表示挑战,这样研究人员就可以专注于生物分析,而不会被繁琐的数据操作拖慢速度,否则甚至只是可视化数据也需要繁琐的数据操作。该框架提供了统一的表示形式并实现了符合人体工程学的操作,以方便处理空间组学数据。”Marconato 说。

该工具使任何研究人员都可以导入他们的数据并执行数据表示、处理和可视化等任务。此外,它还提供了以交互方式注释数据的选项,并将其保存为与语言无关的格式,从而促进了结合不同编程语言或分析社区的方法的分析策略的出现。

该框架是多个机构之间的合作项目,例如 DKFZ、慕尼黑工业大学、慕尼黑亥姆霍兹中心、德国生物成像公司、苏黎世联邦理工学院、比利时 VIB 炎症研究中心以及 EMBL 的 Huber 和 Saka 团队。

“我们在开展研究和技术开发时始终将造福更广泛的科学界作为首要考虑”,论文共同第一作者、慕尼黑亥姆霍兹中心博士生 Giovanni Palla 说道。“我们不仅建立了研究机构之间的跨学科合作项目,还与使用不同空间技术和不同编程语言的开发人员密切合作,以解决互操作性问题。因此,我们的框架与学术界和工业界的绝大多数空间组学分析兼容。由于该框架是公开发布的,其他研究人员现在可以自由使用 SpatialData 来管理自己的数据,并有机会跨各种技术和研究主题进行合作。”

“在我们的论文中,我们阐述了 SpatialData 的三个重要特征,”共同第一作者、苏黎世联邦理工学院博士后研究员 Kevin Yamauchi 解释道。“首先,我们为所有空间组学技术提供了标准化接口和统一存储格式(基于 OME-NGFF)。其次,使用统一表示,我们整合了来自多种模态的信号。在这里,我们在模态之间传输注释,并使用这些传输的注释量化信号。最后,我们提出了一种交互式注释(病理学)图像的方法,并使用注释来分析相关的分子谱。”

SpatialData 提供数据的交互式表示,既可以在硬盘上,也可以在计算机的 RAM 上,从而可以分析大型成像数据或多个几何图形或细胞。该框架的其他突出关键功能是能够在通用坐标系中对齐和注释组学数据。因此,SpatialData 可以高效地管理和操作空间数据集,包括跨测序和成像技术定义通用坐标系。

在乳腺癌中的应用

该跨学科团队使用 SpatialData 框架重新分析了来自 10X Genomics 的多模态乳腺癌数据集,作为概念验证。该数据集包含同一乳腺癌块的连续切片,其中每个切片使用不同的技术进行分析,例如 Visium、Xenium 和单独的 scRNA-seq 数据集。该研究展示了这些技术的互补性。“通过整合 10X Xenium 和 scRNAseq,我们将细胞类型映射到空间中,”DKFZ 博士候选人、该研究的作者之一 Elyas Heidari 说道。“接下来,我们使用 10X Visium 在空间中识别癌症克隆。这是可以做到的,因为我们有转录组范围的读数。最后,我们使用 H&E 染色的显微镜图像来识别组织病理学注释的感兴趣区域。该分析成功展示了 SpatialData 在解锁空间解析数据集的多模态分析方面的独特应用。”

未来,医生可能会使用临床常用的各种技术对患者的肿瘤进行分析,然后通过 SpatialData 统一数据,以全面了解肿瘤。此外,医生还可以通过交互式界面对数据进行注释,从而对特定肿瘤区域和特征进行详细分析,从而有可能实现个性化治疗方法。

版权声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢您的支持与理解。
关键词: