生活网6月5日 消息:近日,全球首个全切片数字病理学模型Prov-GigaPath正式发布,这一创新模型在癌症亚型分类和突变预测方面显著提高了病理诊断的准确性。GigaPath模型采用了两阶段的级联结构,并结合了微软研究院近期开发的LongNet架构,有效解决了处理和理解十亿像素级别图像的难题。
Prov-GigaPath模型从Providence旗下28家美国医院的3万名病人和17万张全切片数字病理学图片中汲取数据,进行深入训练,总计涵盖了13亿张病理学图块。训练结果显示,Prov-GigaPath在26个任务中的25个任务上实现了最先进的性能,与排名第二的方法相比,在18个任务上有显著改进。
在突变预测方面,Prov-GigaPath在TCGA数据集上EGFR突变预测任务中表现尤为出色,与排名第二的模型相比,AUROC提高了23.5%,AUPRC提高了66.4%。这一突破性成果为病理诊断提供了更加准确和可靠的工具,推动了癌症诊断和治疗的进步。
Prov-GigaPath完全开放权重,包括源代码和预训练的模型权重 。
GitHub:https://github.com/prov-gigapath/prov-gigapath
模型:https://huggingface.co/prov-gigapath/prov-gigapath
论文:https://nature.com/articles/s41586-024-07441-w