人工智能工具创建细胞的合成图像以增强显微镜分析
通过显微镜观察单个细胞可以揭示一系列重要的细胞生物学现象,这些现象经常在人类疾病中发挥作用,但是区分单个细胞及其背景的过程非常耗时,而这项任务非常适合人工智能援助。
人工智能模型学习如何通过使用一组由人类注释的数据来执行此类任务,但将细胞与其背景区分开来的过程(称为“单细胞分割”)既耗时又费力。因此,可用于人工智能训练集中的注释数据数量有限。加州大学圣克鲁斯分校的研究人员开发了一种方法来解决这个问题,通过构建显微镜图像生成人工智能模型来创建单细胞的逼真图像,然后将其用作“合成数据”来训练人工智能模型,以更好地进行单细胞分割。
iScience杂志上发表的一篇新论文描述了这款新软件。该项目由生物分子工程助理教授 Ali Shariati 和他的研究生 Abolfazl Zargari 领导。该模型称为cGAN-Seg,可在 GitHub 上免费获取。
“从我们的模型中得出的图像已准备好用于训练分割模型,”Shariati 说。 “从某种意义上说,我们是在没有显微镜的情况下进行显微镜观察,因为我们能够生成在单细胞形态细节方面非常接近细胞真实图像的图像。它的美妙之处在于,当它们从模型中出来时,它们已经被注释和标记了。这些图像与真实图像有很多相似之处,这使我们能够生成模型在训练过程中未见过的新场景。”
通过显微镜看到的单个细胞的图像可以帮助科学家了解细胞随时间的行为和动态,改进疾病检测并寻找新药物。纹理等亚细胞细节可以帮助研究人员回答重要问题,例如细胞是否癌变。
然而,从背景中手动查找和标记细胞的边界非常困难,特别是在图像中有许多细胞的组织样本中。研究人员可能需要几天时间才能对 100 张显微镜图像进行手动细胞分割。
深度学习可以加速这一过程,但需要一个带注释图像的初始数据集来训练模型——至少需要数千张图像作为基线来训练准确的深度学习模型。即使研究人员可以找到并注释 1000 张图像,这些图像也可能不包含在不同实验条件下出现的特征变化。
“你想展示你的深度学习模型在具有不同细胞类型和不同图像质量的不同样本中的工作原理,”扎加里说。 “例如,如果您使用高质量图像训练模型,它将无法分割低质量细胞图像。我们在显微镜领域很少能找到如此好的数据集。”
为了解决这个问题,研究人员创建了一个图像到图像生成人工智能模型,该模型采用有限的一组带注释、标记的细胞图像并生成更多图像,引入更复杂和多样化的亚细胞特征和结构,以创建一组多样化的“合成”图像图片。值得注意的是,它们可以生成具有高密度细胞的注释图像,这特别难以手动注释,并且与研究组织特别相关。该技术可处理和生成不同细胞类型以及不同成像方式的图像,例如使用荧光或组织学染色拍摄的图像。
领导生成模型开发的扎加里采用了一种常用的人工智能算法,称为“循环生成对抗网络”来创建逼真的图像。生成模型通过所谓的“增强功能”和“风格注入网络”得到增强,这有助于生成器创建各种高质量的合成图像,显示细胞外观的不同可能性。据研究人员所知,这是首次在这种情况下使用样式注入技术。
然后,生成器创建的这组多样化的合成图像用于训练模型,以对实验期间拍摄的新的真实图像准确地进行细胞分割。