IEEE TIP | 深圳先进院提出非平衡自信息传输新理论方法 破解弱配对病理虚拟染色技术难题
免疫组化(IHC)病理图像虚拟染色通过将临床常用的H&E染色图像转换为特定分子标志物表达的IHC图像,为病理诊断提供了更丰富的信息。然而,AI虚拟染色技术的发展面临两大挑战:数据空间异质性:H&E和IHC切片间病理特征的不一致性,可能导致虚拟染色模型生成错误的病理阳性区域。临床诊断先验的忽视:H&E图像中,病变区形态及细胞异常性携带的隐式诊断先验(如疾病亚型和对应IHC染色模式),以及相邻切片的病理表达一致性,常被传统AI方法忽略。
近日,beat365在线体育app(以下简称“深圳先进院”)医学成像科学与技术系统全国重点实验室秦文健研究员团队在病理图像智能分析领域取得重要突破,提出一种非平衡自信息特征传输生成对抗网络(USIGAN),成功攻克弱配对条件下免疫组化(IHC)虚拟染色的空间异质性与病理语义失准难题,显著提升虚拟染色结果的内容一致性与临床诊断价值。相关成果以"USIGAN: Unbalanced Self-Information Feature Transport for Weakly Paired Image IHC Virtual Staining" 为题,发表于图像处理领域顶级期刊IEEE Transactions on Image Processing(CCF-A期刊,影响因子 13.7)。
在数字病理临床诊断流程中,H&E 染色与 IHC 染色是肿瘤诊断和方案决策的核心依据。传统流程依赖连续切片人工比对,成本高、周期长、一致性差。虚拟染色技术旨在通过 AI 直接由 H&E 图像生成对应 IHC 染色,大幅提升效率。但临床真实数据普遍存在弱配对问题:相邻切片组织形态错位、空间异质性强,现有方法易出现 “一对多错误映射”,导致染色位置偏移、强度失真、病理语义不符,难以满足临床诊断要求。
针对这一临床痛点,团队首次将自信息挖掘与非平衡最优传输引入病理虚拟染色,提出了一种基于非平衡自信息传输的弱配对训练方法,通过引入全新的间接学习策略,规避了传统模型中因弱配对图像优化所导致的“病态解逆”问题。此方法显著提升了虚拟染色的病理表达可靠性与准确性。具体来说,该方法解决了以下关键技术难点:
1. 弱配对图像映射关系的精准构建:通过利用非完全配对的图像数据,使模型能够从少量局部配对信息中学习关键特征关联性。
2. 结构表达隐式先验的融入:充分利用H&E染色图像中异常形态与阳性免疫表达的内在关系,提高模型对真实病理表达区域的预测能力。
3. 避免病态优化目标:通过间接学习策略,绕开传统方法中对弱配对图像直接优化的限制,显著改善了模型泛化性能。
“如何通过两个可能不配对的区域集合,构建准确的映射关系?”是AI虚拟染色模型的一大核心难题。传统方法主要聚焦于提高准确配对区域对模型训练的贡献度,但仍面临弱配对引发的病态优化问题。对此,研究团队另辟蹊径,通过规避优化目标中弱配对项引发的病态求逆,提出了独特的间接学习策略,绕开对弱配对图像直接优化的限制,从而有效提升了模型训练的稳定性和病理表达的精准性。这一创新思路在降低数据依赖的同时,为虚拟染色模型构建更准确的映射关系提供了全新解决方案。
团队首先在 MIST、IHC4BC 两大国际公开乳腺病理数据集(涵盖 Ki‑67、ER、PR、HER2 四大关键标志物)开展系统实验分析。结果显示生成的 HER2、ER、PR、Ki67 虚拟染色结果在细胞结构完整性、染色强度分布以及肿瘤区域表达模式方面均与真实 IHC 染色高度一致,肿瘤细胞核与细胞质的表达边界清晰,背景区域抑制良好,整体呈现出良好的病理语义一致性。
更进一步的,研究团队通过两种方式验证了虚拟染色图像的质量与临床适用性:
(1)定量与主观评价:通过训练下游分类模型,以及病理医生对虚拟染色图像的评分,分别验证了模型在内容保持度、感知一致性和病理表达一致性三个指标上的性能。评估结果显示,这些指标均达到了临床可接受水平(评分均超过3分/5分)。
(2)真实临床数据验证:研究团队利用公开数据集训练的模型,直接应用于临床医院的真实临床数据进行测试。结果表明,虚拟染色模型在真实场景中展现出准确的预测能力。
该研究完全消除弱配对数据的负面影响,为无标注、弱配对病理虚拟染色提供全新范式,有望应用于乳腺癌等肿瘤快速分型、靶向药物筛选、病理 AI 质控等场景,加速数字病理智能化与普惠化进程。
深圳先进院博士生彭月和硕士生熊兵为该研究共同第一作者,深圳先进院秦文健研究员为论文通讯作者,香港理工大学蔡璟教授提供学术指导和技术支持,中山大学肿瘤防治中心胡婉明副主任医师提供临床指导和数据支撑。该研究工作得到了国家重点研发计划青年科学家、国家自然科学基金面上项目、深港肿瘤影像智能计算分析联合实验室以及中国科学院青年创新促进会会员等资助。

图1: 弱配对数据的挑战以及自信息挖掘的潜力

图2: USIGAN方法整体流程示意:从非平衡最优传输的循环传输策略与批次内光密度一致策略

图3:不同虚拟染色方法在多种IHC生物标志物上结果对比示意

图4:病理医生打分
附件下载: