Cell重磅!微软开源首个AI肿瘤免疫模型,仅需几美元成本,一键看穿癌症底细!

AI与医学的深度融合,为健康领域的进步创造了前所未有的机遇。

近日,微软团队发布了GigaTIME,这是第一个能以极低成本、大规模地获得肿瘤微环境(TME)数据的AI模型。

简单而言,GigaTIME学习了4000万细胞数据能够将5~10美元的肿瘤病理切片,一键转化为价值高达几千美元肿瘤免疫数据(mIF)。

这将使得医生深入洞察肿瘤的免疫特性,识别出患者肿瘤免疫组成、癌症阶段、患者存活率、潜在用药方案等,并生成个性化的治疗方案!

该成果以“Multimodal AI generates virtual population for tumor microenvironment modeling”为题,发表在了Cell上。

Cell重磅!微软开源首个AI肿瘤免疫模型,仅需几美元成本,一键看穿癌症底细!

与此同时,微软将GigaTIME在Hugging Face、GitHub和Microsoft Foundry等平台上开源。

链接:https://github.com/prov-gigatime/GigaTIME

团队表示,该成果有望极大地推动精准免疫肿瘤学研究。

仅几美元成本,一键生成肿瘤免疫数据

当前,癌症治疗已经从研究肿瘤细胞转向了“肿瘤免疫学”

 

其中重中之重,就是“肿瘤微环境”(TME),带来了癌症治疗观念和理念的革新。

 

“肿瘤微环境”,即肿瘤的生长、转移和治疗响应,并非仅由癌细胞决定,而是由其与周围免疫细胞、基质细胞、血管、神经及信号分子动态相互作用的结果。

 

也就是说,科学家们从杀死癌细胞,转向了治理滋生癌细胞的生态系统。

 

无论是药物研发,还是临床治疗都依赖肿瘤微环境研究。尤其是,几乎所有靶向疗法都会面临耐药,TME研究是解开耐药谜题的关键钥匙。

 

这其中,多重免疫荧光(mIF)技术,又是解析肿瘤微环境最核心的空间成像技术之一。

它可以揭示肿瘤微环境中蛋白质表达的关键信息,帮助医生判断免疫细胞是否积极对抗癌细胞。

 

但mIF不仅价格昂贵,且非常耗时。仅仅一个样本花费数千美元,耗时数天,导致难以在临床推广。

 

研究人员绞尽脑汁:有没有什么低成本的方式,实现患者肿瘤免疫研究?

 

于是微软联合华盛顿大学研究团队,以及普罗维登斯医疗机构,共同开发了GigaTIME模型。

 

它仅仅用标准病理学切片(H&E),一键生成高分辨率的mIF数据。

Cell重磅!微软开源首个AI肿瘤免疫模型,仅需几美元成本,一键看穿癌症底细!

图:GigaTIME工作流示意图

要知道,病理切片已成为癌症治疗中常规手段,每张售价仅5至10美元,有望极大地节省了肿瘤免疫研究成本。

 

首先,研究人员整理了清洗了大量数据,该数据集包含4000万个细胞,配对的病理学切片和mIF图像,跨21个蛋白质通道。

 

基于这些珍贵的数据集训练了GigaTIME模型,只需输入一张新的、从未见过的H&E切片,就能在几秒钟内预测并生成对应的高分辨率虚拟mIF图像,展示多种免疫细胞在肿瘤中的空间分布。

随后,研究团队将GigaTIME应用于普罗维登斯医疗系统内51家医院和1000多家诊所中14,256名癌症患者的病理样本。

 

最终,生成了覆盖 24 种癌症类型和 306 种亚型的约30万张虚拟mIF切片,从而构建了一个大规模、多样化的虚拟数据。

 

等于说,GigaTIME实现对数十种癌症类型和数百种亚型肿瘤微环境的群体尺度分析。

未来展望:变革癌症诊疗方式

微软称,这是历史上首个大规模的多模态AI用于生成肿瘤微环境数据的模型。

 

那么问题来了,耗费大量的时间进行建模,生成一堆mIF数据有什么好处?

 

研究人员表示,它将极大地推动精准免疫肿瘤学的发展。

 

例如,该模型能够从种群尺度上预测关键生物标志物,实现精准肿瘤分诊。

 

利用这个庞大的虚拟数据集,研究人员发现了1,234个具有统计学显著性的新关联,揭示了不同蛋白质表达与临床生物标志物(如基因突变、肿瘤突变负荷等)之间的关系,这些发现往往因成本限制而难以实现。

Cell重磅!微软开源首个AI肿瘤免疫模型,仅需几美元成本,一键看穿癌症底细!

图:GigaTIME识别出泛癌、癌症类型、癌症亚型等层面上TIME蛋白与生物标志物的新关联

不仅如此,研究人员还10,200名患者上进行了独立的外部验证,将癌症基因组图谱(TCGA)数据集与生成虚拟mIF相比较。

 

最终观察到显著一致性,癌症亚型间虚拟蛋白激活的Spearman相关系数为0.88。

也就是说,生成的虚拟数据与真实世界数据高度一致,证明了其可靠性和普适性。

Cell重磅!微软开源首个AI肿瘤免疫模型,仅需几美元成本,一键看穿癌症底细!

也就是说,科学家们和医生有望精准地识别出患者肿瘤免疫组成、癌症阶段、患者存活率、潜在用药方案等……

 

不止如此,团队还有一个更大的目标——构建强大的“虚拟患者”

 

未来,它可以融合患者个人的病理、基因组、影像学等多维度数据,构建个性化的患者“数字孪生”模型,用于预测疾病进展和治疗反应,变革临床诊疗一刀切的方式。

 

它将极大地协助药物研究,从而降低当前将新癌症治疗推向市场所需的巨大成本和时间。

文章来自于“智药局”,作者 “王苏”。

给TA充电
共{{data.count}}人
人已充电
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
搜索