论文:Medical Visual Question Answering: A Survey

作者:Zhihong Lin,Donghao Zhang,Qingyi Tac,Danli Shi,Gholamreza Haffari,Qi Wu,Mingguang He,Zongyuan Ge

机构:beResearch Center, Monash University, Clayton, VIC, Australia, NVIDIA AI Technology Center, Singapore, State Key Laboratory of Ophthalmology, Zhongshan Ophthalmic Center, Sun Yat-Sen University, Guangzhou, China

摘要:医学视觉问答(VQA)是医学人工智能和流行的VQA挑战的结合。给定一幅医学图像和一个自然语言的临床相关问题,医学VQA系统预计将预测一个可信和令人信服的答案。虽然已经对一般领域的VQA进行了广泛的研究,但医学VQA由于其任务的特点,仍然需要具体的调查和探索。在本次调查的第一部分中,我们涵盖并讨论了最新公开的医疗VQA数据集,包括数据源、数据量和任务特征。在第二部分中,我们回顾了医学VQA任务中使用的方法。在最后一部分,我们分析了该领域面临的一些医学挑战,并讨论了未来的研究方向。

数据集概述:

方法概览:

编码器使用情况:


我们对今年发布的计算机视觉领域的技术综述都进行了汇总和分类盘点,并持续更新在我们的Github

在这里插入图片描述

另外推荐大家关注极市平台公众号,每天都会更新最新的计算机视觉论文解读、综述盘点、调参攻略、面试经验等干货~

在这里插入图片描述

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐