
Eric A. Vitriol 博士。图片来源:奥古斯塔大学 Michael Holahan
一种新的“图像分析管道”正在让科学家们快速了解疾病或损伤如何改变身体,直至单个细胞。
它被称为 TDAExplore,它采用显微镜提供的详细成像,将其与称为拓扑的热门数学领域配对,该领域提供关于事物如何排列的洞察力,以及人工智能的分析能力,例如,提供新的视角乔治亚医学院的细胞生物学家和神经科学家 Eric Vitriol 博士说,由 ALS 引起的细胞变化以及它们发生在细胞的什么位置。
他们在报告中报告说,使用个人计算机从显微图像中生成定量的、可测量的、因此是客观的信息,这些信息可能也适用于 X 射线和 PET 扫(sǎo)描(miáo)等(děng)其(qí)他(tā)标(biāo)准(zhǔn)成(chéng)像(xiàng)技(jì)术(shù),这(zhè)是(shì)一(yī)种(zhǒng)“可(kě)访(fǎng)问(wèn)、强(qiáng)大(dà)的(de)选(xuǎn)择(zé)”杂(zá)志(zhì)模(mó)式(shì)。
“我(wǒ)们(men)认(rèn)为(wèi)这(zhè)是(shì)使(shǐ)用(yòng)计(jì)算(suàn)机(jī)为(wèi)我(wǒ)们(men)提(tí)供(gōng)有(yǒu)关图(tú)像(xiàng)集彼(bǐ)此(cǐ)不(bù)同(tóng)的(de)新(xīn)信(xìn)息(xi)的(de)令(lìng)人(rén)兴(xìng)奋(fèn)的(de)进(jìn)展(zhǎn),”Vitriol 说(shuō)。“正在发生的实际生物学变化是什么,包括那些我可能看不到的变化,因为它们太微小了,或者因为我对应该看的地方有某种偏见。”
神经科学家说,至少在分析数据部门,计算机比我们的大脑更胜一筹,不仅在它们的客观性上,而且在它们可以评估的数据量上。计算机视觉,使计算机能够从数字图像中提取信息,是一种已经存在了几十年的机器学习,因此他和他的同事兼通讯作者、佛罗里达大学的数学家和专家Peter Bubenik 博士在拓扑数据分析方面,决定将显微镜的细节与拓扑科学和人工智能的分析能力结合起来。Vitriol 说,拓扑和 Bubenik 是关键。
拓扑对于图像分析来说是“完美的”,因为图像由排列在空间中的对象的图案组成,他说,拓扑数据分析(TDAExplore 中的 TDA)帮助计算机也识别地形,在这种情况下,肌动蛋白——一种蛋白质和纤维或细丝的基本组成部分,有助于赋予细胞形状和运动——已经移动或改变了密度。这是一个高效的系统,它可以学习 20 到 25 张图像,而不是使用数百张图像来训练计算机如何识别和分类它们。
部分神奇之处在于计算机现在正在学习他们称之为补丁的图像。他们写道,将显微镜图像分解成这些片段可以实现更准确的分类,减少对计算机“正常”外观的训练,并最终提取有意义的数据。
毫无疑问,显微镜可以对人眼看不到的东西进行仔细检查,产生美丽、详细的图像和动态视频,这是许多科学家的支柱。“如果没有精密的显微镜设备,就不可能拥有一所医学院,”他说。
但要首先了解什么是正常的以及在疾病状态下会发生什么,Vitriol 需要对图像进行详细分析,例如细丝的数量;细丝在细胞中的位置——靠近边缘、中心、分散在各处——以及某些细胞区域是否有更多。
在这种情(qíng)况(kuàng)下出现的模式告诉他肌动蛋白在哪里以及它是如何组织的——这是其功能的一个主要因素——以及它在哪里、如何以及(jí)是(shì)否(fǒu)随(suí)着疾病或损伤而发生变化。
例如,当他观察中枢神经系统细胞边缘周围的肌动蛋白簇时,该组合告诉他细胞正在向外扩散,四处移动并发出成为其前沿的投影。在这种情况下,基本上在培养皿中处于休眠状态的细胞可以展开并伸展它的腿。
科学家直接分析图像并计算他们所看到的内容的一些问题包括它很耗时以及即使科学家也有偏见的现实。
举个例子,特别是在发生这么多动作的情况下,他们的眼睛可能会落在熟悉的地方,在 Vitriol 的例子中,就是位于细胞前缘的肌动蛋白。当他再次查看细胞(bāo)外(wài)围(wéi)的(de)黑(hēi)框(kuāng)时(shí),清(qīng)楚(chu)地(de)表(biǎo)明(míng)肌(jī)动(dòng)蛋(dàn)白(bái)聚(jù)集在(zài)那(nà)里(lǐ),这(zhè)可(kě)能(néng)意(yì)味(wèi)着这是主要的作用点。
“当我决定有什么不同时,我怎么知道这是最不同的事情,或者这正是我想看到的?”他说。 “我们希望给(gěi)它(tā)带(dài)来(lái)计(jì)算(suàn)机(jī)的(de)客(kè)观(guān)性(xìng),我(wǒ)们(men)希(xī)望(wàng)将(jiāng)更(gèng)高(gāo)程(chéng)度(dù)的(de)模(mó)式(shì)识(shi)别(bié)带(dài)入图像分析中。”
众所周(zhōu)知,人工智能能够(gòu)“分(fēn)类(lèi)”事(shì)物(wù),例(lì)如(rú)每(měi)次(cì)都(dōu)能(néng)识(shi)别(bié)狗(gǒu)或(huò)猫(māo),即(jí)使(shǐ)图(tú)片(piàn)很(hěn)模(mó)糊(hu),首(shǒu)先(xiān)要(yào)学(xué)习(xí)与(yǔ)每(měi)只(zhǐ)动(dòng)物(wù)相(xiāng)关的(de)数(shù)百(bǎi)万(wàn)个(gè)变(biàn)量(liàng),直(zhí)到(dào)它(tā)看(kàn)到(dào)一(yī)只(zhǐ)狗(gǒu)时(shí)才(cái)知(zhī)道(dào)它,但它不能报告为什么它是一只狗。这种方法需要大量图像用于训练目的,但仍然不能提供很多图像统计数据,但实际上并不适合他的目的,这就是为什么他和他的同事制作了一个仅限于拓扑数据(jù)分(fēn)析(xī)的(de)新(xīn)分(fēn)类(lèi)器。
他说,最重要的是,TDAExplore 中使用的独特耦合有效而客观地告诉科学家,受扰动的细胞图像与训练或正常图像的信息在哪里以及有多大不同,这也提供了新的想法和研究方向。
回到显示肌动蛋白沿其周边聚集的细胞图像,而“前沿”与扰动明显不同,TDAExplore 表明一些最大的变化实际上是在细胞内部。
“我的很多工作都是试图在图像中找到难以看到的模式,”Vitriol 说,“因为我需要识别这(zhè)些(xiē)模式,这样我才能找到从这些图像中获取数字的方法。” 他的底线包括弄清楚肌动蛋白细胞骨架是如何工作的,肌动蛋白细胞骨架是细丝为它提供支架,反过来又为神经元提供支持,以及在像 ALS 这样的情况下会出现什么问题。
研究人员写道,其中一些需要数百张图像来训练和分类图像的机器学习模型没有描述图像的哪一部分有助于分类。如此庞大的数据需要分析,可能(néng)包括大约 2025 万个变量,需要一台超级计算机。相反,新系统需要相对较少的高分辨率图像,并表征导致所选分类的“补丁”。在几分钟内,科学家的标准个人电脑就可以完成新的图像分析流程。
他说,TDAExplore 中使用的独特方法客观地告诉科学家,扰动图像与训练图像在哪里以及有多大不同,这些信息也提供了新的想法和研究方向。
从图像中获取更多更好信息的能力最终意味着由像 Vitriol 这样的基础科学家生成的信息更加准确,这些信息通常最终会改变被认为是疾病的事实和治疗方式。这可能包括能够识别以前被忽视的变化,例如新系统在细胞内指出的变化。
他说,目前科学家们使用染色剂来获得更好的对比度,然后使用软件提取他们在图像中看到的信息,比如肌动蛋白是如何组织成更大的结构的。
“我们必须想出(chū)一种从图像中获取相关数据的新方法,这就是本文的内容。”
参(cān)考:“TDAExplore:通过基于拓扑的机器学习对荧光显微镜图像进行定量分析”,作者:Parker Edwards、Kristen Skruber、Nikola Milicevic、James B. Heidings、Tracy-Ann Read、Peter Bubenik 和 Eric A. Vitriol,2025 年 10 月 12 日(rì),图(tú)案(àn)。
DOI: 10.1016/j.patter.2025.100367
已发表的研究为其他科学家提供了使用 TDAExplore 的所有内容。
该研究得到了美国国立卫生研究院的支持。
