邮箱:mamobio@163.com

首页 > 学术前沿 > 神经医学 > 文献解读:用于脑疾病临床诊断的鲁棒自适应深度学习算法

学术前沿

推荐新闻

研究新闻

产业文章

文献解读:用于脑疾病临床诊断的鲁棒自适应深度学习算法

发布:大分子生物 阅读量: 神经医学 2022-07-06

清华大学戴院士和解放军总医院楼新教授团队最近发表的《柳叶刀数字健康》最新研究成果,提出了鲁棒自适应深度学习算法(Rolo),从医学图像报告中自动提取的低质量信息(弱注释)可用于指导脑CT图像中疾病的识别和定位,从而实现脑出血、脑梗死、脑肿瘤和颅骨骨折等常见脑部疾病的诊断。该算法的训练不需要医生和专家的高质量注释,因此它可以使用大量历史图像数据来提高深度神经网络的准确性、泛化性和可解释性

通过回顾性、前瞻性和跨中心实验验证了其优越的诊断性能。并进一步开发了辅助诊断系统,显著提高了医生在图像诊断中的准确性。该算法和系统的推广有望帮助提高脑疾病的临床诊断水平,支持准确治疗,并可能改变未来的医疗保健和生物医学研究模式。本研究由清华大学、解放军总医院和湖南省脑科医院共同完成。助理研究员郭玉辰、何玉伟博士、吕金浩博士、研究生周占平为第一作者;戴教授、楼新教授和徐峰副教授是联合通讯员

研究背景

脑卒中等脑部疾病具有很高的致死致残率,是身体健康的重大威胁。[1]据统计,中国每年的死亡人口中,脑疾病在致死原因里排名前列。[2]实现脑疾病的快速、精准诊断对降低致死致残率有重要价值。然而,脑疾病类型多、情况复杂,对诊断带来巨大挑战,尤其是在缺少高水平医生的欠发达地区。因此,亟需研发高效精准的脑疾病智能辅助诊断系统,提升医生诊断的准确率与效率。

脑部疾病(如脑出血、脑梗死、脑肿瘤、颅骨骨折等)对大脑的结构和功能有重大影响,具有较高的发病率和死亡率及致残率。准确、快速的诊断对患者的治疗、降低病死率和致残率、改善预后具有重要意义。目前,CT成像在脑疾病的诊断中发挥着重要作用,且发病率较高。然而,基于CT图像的脑部疾病诊断是放射科医生的一项繁重工作,许多中低收入地区缺乏高水平的放射科医生,这给准确、快速诊断脑部疾病带来了挑战。因此,开发一个能够诊断多种脑部疾病的辅助诊断系统在医学应用中具有很大的实用价值。

目前,深度学习在医学辅助诊断任务中显示出巨大的潜力。为了建立一个高精度和泛化的深度学习辅助诊断系统,通常需要大量高质量的标记训练数据集来确保模型能够学习正确和多样的信息。虽然可以使用历史数据收集大量CT图像数据,但对齐注释非常困难且昂贵。因此,迫切需要新的深度学习技术,该技术可以构建一个低成本、高效率、高精度、泛化的深度学习辅助诊断系统。

在本研究中,提出了鲁棒的自适应深度学习算法Rolo,开发了一个应用系统,以实现基于CT图像的多类型脑的高精度和泛化辅助诊断。该算法不需要任何专家手动标注,只需要从历史图像报告中自动提取不可靠信息来指导学习。通过鲁棒自适应算法,可以从中学习有效信息。通过回顾性、前瞻性和跨中心实验,验证了系统的准确性和泛化能力。该系统可以显著提高放射科医生的诊断准确性。它的进一步推广将有助于提高脑疾病的临床诊断水平,支持准确的治疗,也可能改变未来医疗保健和生物医学研究的模式。

研究方法

本研究收集了解放军总医院630,992份CT序列,以及相应的121,576份影像报告,覆盖了脑出血、脑梗、脑肿瘤和颅骨骨折四大类常见病种,以及部分无异常CT。通过数据匹配与清洗,最终得到107,754份CT序列,其中104,597份用于模型训练,800份用于验证,2,357份作为回顾性测试集。进一步于解放军总医院前瞻性地收集并构建了650例CT序列,作为前瞻性测试集。于湖南省脑科医院收集并构建了1,525例CT序列,作为跨中心测试集。并利用来自印度的CQ500数据集,作为跨国测试集。对于训练数据,通过影像报告中的疾病关键词匹配,自动地为CT序列获得了序列级别的疾病类型标注,从而无需使用任何人工标注。

在标注获取上的高效率却给模型训练带来了挑战。由于训练标注是自动获取的,其中部分标注(经小范围统计估计约14%标注存在错误)有误;同时标注只是在整个序列级别,无法具体给出病灶在CT影像中具体的定位。这些问题都给传统的深度学习带来了挑战。为了解决这些问题,本研究提出了RoLo算法,通过鲁棒的算法克服标注错误的影响,并通过多示例学习自动通过序列级别的标注完成CT影像中像素级别的病灶定位,这也可以为医生用户提供可理解的影像信息,帮助医生做出决策,提升决策准确性。

补充材料图1:数据集、系统与算法构建总览

补充材料图1:数据集、系统与算法构建总览

研究结果

(1)系统可以实现高精度、可泛化的多类型脑部疾病识别

将本系统在多个测试集上进行验证。针对四种疾病的识别,平均AUC在回顾性测试集上为0.976,在前瞻性测试集上为0.975,在跨中心测试集上为0.965,在跨国测试集(CQ500,包含两种疾病)上为0.964,在跨设备测试集上为0.971。结果表明了该系统有高准确率,且在不同数据集上性能稳定,也验证了它良好的泛化性能。通过与放射科医生诊断结果的对比,本系统可以达到中年资医生的水平(图1E)。同时,本系统在针对不同大小病灶的诊断上也有比较稳定的性能,即使是对直径不足7mm的病灶,敏感度也能达到95%以上(图1F)。此外,通过调整训练集大小可以发现,随着训练集增加,系统性能也显著上升(图1G)。由于本系统的训练无需任何人工标注,因此训练集的增加也几乎无需额外成本,却能带来显著性能提升,这为本系统的进一步推广和提升奠定了基础。

原文表:在回顾性、前瞻性、跨中心、跨设备测试集上的性能

原文表:在回顾性、前瞻性、跨中心、跨设备测试集上的性能

原文图1:E. 与四名放射科医生的对比,年资分别为5年(橙色)、10年(绿色)、10年(蓝色)和11年(紫色)。

原文图1:E. 与四名放射科医生的对比,年资分别为5年(橙色)、10年(绿色)、10年(蓝色)和11年(紫色)。F. 针对不同大小的病灶的性能。G. 在使用训练集大小时,在CQ500上的性能。H. 系统定位的病灶区域与真实病灶区域的重合程度。I. 在使用本系统前后,4名放射科医生的针对不同疾病诊断的准确率变化情况。

(2)系统可以实现可理解的诊断,辅助提升医生准确率

尽管训练数据标注只是序列级别的,但是RoLo通过多示例学习、注意力机制等方法实现了对病灶的像素级定位,并且可以达到较高的定位精度(图1H)。基于此,研发了辅助诊断与可视化软件(补充材料图3),可以显示病种类别和病灶位置,为医生的最终决策提供支持。基于该软件,对比了四名放射科医生在使用软件前后的诊断结果,该软件对于四种疾病诊断的平均敏感度提升了0.109,特异度提升了0.022(图1I)。

补充材料图3:辅助诊断及可视化软件

补充材料图3:辅助诊断及可视化软件

结论

构建一个低成本、高效率、高精度、通用性的医学图像辅助诊断系统具有重要的临床应用价值。在本研究中,提出了鲁棒的自适应深度学习算法(Rolo),该算法仅使用从医学图像报告中自动提取的不可靠信息(弱注释),而无需任何医生专家注释,就可以构建一个高精度和泛化的医学图像辅助诊断系统。实现了脑出血、脑梗死、脑肿瘤、颅骨骨折等常见脑部疾病的诊断,显著提高了医生图像诊断的准确性。该算法和系统的推广有望帮助提高脑疾病的临床诊断水平,支持准确治疗,并可能改变未来的医疗保健和生物医学研究模式。

参考文献

[1] Johnson CO, et al. Global, regional, and national burden of stroke, 1990–2016: a systematic analysis for the Global Burden of Disease Study 2016. The Lancet Neurology. 2019 May 1;18(5):439-58.

[2] Zhou M, Wang H, et al. Mortality, morbidity, and risk factors in China and its provinces, 1990–2017: a systematic analysis for the Global Burden of Disease Study 2017. The Lancet. 2019 Sep 28;394(10204):1145-58.


(声明:本网所转载的文章内容仅作为信息资源提供与分享,并不意味着代表本站观点或证实其内容的真实性,不用于或依赖于任何诊断或治疗目的,此信息不应替代专业诊断或治疗,如有不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理!)

加载中~
加入收藏 ()
分享
加载中~