首页 > 技术知识 > 正文

谷歌详细介绍了可以对人类胸部X射线进行准确分类的AI 上图:胸部X线片描绘了由Google的AI模型和放射线专家小组识别出的气胸,但个别放射线医师漏诊了。左图是原始图像,右图是同一图像,其中用于模型预测的最重要区域以橙色突出显示。

用机器学习算法分析胸部X射线图像说起来容易做起来难。这是因为通常情况下,训练这些算法所需的临床标签是通过基于规则的自然语言处理或人工注释获得的,这两种方法都容易引起不一致和错误。此外,要收集代表各种病例的数据集,并仅给出图像就建立具有临床意义且一致的标签是很困难的。

为了在x线图像分类方面取得进展,谷歌的研究人员设计了人工智能模型来识别人类胸部x线的四个发现:气胸(肺萎陷)、结节和肿块、骨折和空气混浊(肺树状物填充)。在《自然》杂志上发表的一篇论文中,研究小组称,在由人类专家进行的一项独立评估中,该模型家族表现出了“放射学家水平”的表现。

这项研究发表前几个月,谷歌人工智能和西北医学院的科学家们创造了一个模型,能够比平均有8年经验的人类放射科医生更好地通过筛查试验检测肺癌,大约一年前,纽约大学使用谷歌的Inception v3机器学习模型来检测肺癌。人工智能还支撑着这家科技巨头在通过眼部扫描诊断糖尿病视网膜病变方面的进步,以及Alphabet子公司DeepMind的人工智能,它可以为50种眼病推荐正确的治疗方案,准确率高达94%。

这项较新的工作利用了来自两个未识别数据集的600,000张图像,其中第一个是与阿波罗医院合作开发的,其中包括多年来从多个位置收集的X射线。至于第二语料库,它是美国国立卫生研究院(National Institutes of Health)发布的可公开获得的ChestX-ray14图像集,该图像集过去一直是AI努力的资源,但准确性存在缺陷。

研究人员开发了一个基于文本的系统,使用与每个X射线相关的放射学报告提取标签,然后他们将其应用于为阿波罗医院数据集中的560,000张图像提供标签。为了减少基于文本的标签提取引入的错误并为多个ChestX-ray14图像提供相关标签,他们招募了放射科医生来审查两个语料库中大约37,000张图像。

下一步是生成用于模型评估目的的高质量参考标签。采用了基于小组的程序,其中三名放射科医生审查了所有最终调谐和测试集图像,并通过在线讨论解决了分歧。研究的共同作者说,这使得最初仅由一名放射科医生发现的困难发现得以识别和适当记录。

Google指出,尽管这些模型总体上达到了专家级的准确性,但整个语料库的性能却有所不同。例如,对于放射科医师,对于ChestX-ray14图像,检测气胸的敏感性约为79%,而在其他数据集上,对于同一放射科医师,其敏感性仅为52%。

Google研究科学家David Steiner博士和Google Health技术负责人Shravya Shetty在博客文章中写道:“数据集之间的性能差异……强调了需要具有准确参考标准的标准化评估图像集,以便进行研究之间的比较。”谁为论文做出了贡献。“ [模型]通常会确定放射科医生始终忽略的发现,反之亦然。因此,将[AI]系统和人类专家的独特“技能”结合在一起的策略可能最有希望实现AI在医学图像解释中的应用潜力。”

研究团队希望通过为ChestX-ray14数据集提供裁定标签的全集来为高级方法打下基础,他们已经在开源中提供了这些信息。它包含2,412个训练和验证集图像和1,962个测试集图像,或总共4,374张图像。

“我们希望这些标签将有助于未来的机器学习工作,并能更好地对x光胸透机器学习模型进行比较。” Steiner和Shetty写道。

声明:本文由易百纳技术社区编写,文章内容来自venturebeat,版权归原作者所有,转载请注明出处,如有侵权请联系删除。

猜你喜欢