
新型冠状病毒肺炎(COVID-19)疫情暴发以来,作为全球突发重大公共卫生事件,受检者骤然增多、影像学数据海量增长,均给一线的医务工作者带来了巨大的压力。此时,快速、精准的影像诊断显得尤为重要,这是疫情成功防控的重要环节,同时也面临着严峻的挑战。COVID-19影像人工智能产品的及时研发在提高诊疗效率方面发挥了重要的作用,但也显现出了我国人工智产品研发过程中亟需解决的共性问题,需要引起政府及业界的重视,以加速产业的健康发展。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
在新型冠状病毒肺炎(COVID-19)影像学检查需求的驱动下,多种COVID-19影像人工智能(artificial intelligence, AI)产品及时研发、部署,在抗疫一线发挥了重要的作用。其对COVID-19多模态影像的智能分割、病灶检测、图像分析、预后评估等方面取得了一定效果[1, 2, 3]。同时,在产品研发过程中,也再次显像了AI产品研发过程中亟需解决的共性问题,如高质量医疗大数据集与规范标注、数据归属与应用、AI技术创新、产品临床验证等。为了推动疫情后医学影像AI技术的快速落地与应用普及,本文组织业界专家,对COVID-19的AI产品进行剖析,以期引发相关部门重视,推动业界思考和配合,加速肺炎AI产品的发展和应用。
确诊COVID-19的依据是核酸检测。但放射学在发现肺内病变,评估病变的大小、范围、严重程度和演变过程发挥了重要的作用[4, 5]。COVID-19疫情期间,临床上面临的主要问题是在短时间内阅读和分析大量的CT图像,这无疑对影像科的读片和诊断是一个巨大的挑战,故借助AI的辅助,实现快速、准确的影像学判断至关重要。
1.影像学和临床的需求主要有:(1)智能扫描;(2)发现病变,确定病变的分布位置;(3)计算病变的体积大小与正常肺组织之比;(4)判断病变类型如实变、磨玻璃影等;(5)分析病变与支气管和肺血管之间的关系;(6)明确病变的性质,如病毒性肺炎、细菌性肺炎等;(7)分析病变的转归与演变过程,以及自动对比病变的消长情况;(7)评估肺血管有无血栓形成。
2.所涉及的工程学问题包括:(1)正常肺组织与病变的自动提取、分割、配准和计算;(2)基于密度差的不同病变性质计算;(3)基于正常和病变图像的3D建模包括:肺叶裂、肺叶、全肺体积,病变性质的计算和可视化;(4)基于图像的病变和肺血管、支气管分割、计算和可视化等。
全球医疗、科研机构以及AI相关企业在智能扫描、快速诊断和病情评估等方面进行了紧急研发,旨在减少接触传播及时分诊、优先排序、定量评估、早期诊断、预测病情、评估疗效等,从而助力临床医师快捷高效地作出诊断和科学施治,目前取得了良好的效果。
1.AI智能扫描:AI辅助的CT扫描技术目前可以实现智能定位、精准识别和个性化扫描剂量控制。其自动监控系统可通过人体姿势识别确认患者胸部的扫描范围,实现自动摆位,使放射科技师与患者零接触,最大限度地减少医技人员与患者的直接接触,大幅降低了交叉感染的风险[6]。完成初步定位后,AI辅助的CT扫描技术可快速进行扫描,通过分割技术自动提取定位像中肺野范围,精准确定扫描范围,从而减少扫描过程中不必要的辐射。智能kV模式对于不同体质指数的患者实现了自动调节kV,提供达到符合诊断要求的最低辐射剂量。
2.AI辅助诊断:AI能协助放射科医师快速诊断COVID-19,包括检出肺部病变,并能对COVID-19、常见社区获得性肺炎、部分其他病毒性肺炎进行初步鉴别,输出可能性诊断[3, 7]。目前,部分COVID-19影像AI模型鉴别诊断的ROC曲线下面积可达到0.95,灵敏度高于90%,特异度和准确度均高于84%;放射科医师在AI辅助下鉴别COVID-19和其他肺炎的效率显著高于单纯使用AI诊断(灵敏度分别为88%、79%,特异度分别为91%、88%,准确度分别为90%、85%)[2, 8]。目前,临床实践应用场景中,大部分模型能够进行肺炎的检出和定量分析,但尚不能达到准确区分病毒性肺炎类别的目的,还需要进一步的训练优化和临床验证。
3.AI病情与疗效评估:AI可以准确计算COVID-19病变在肺内所占容积比和病灶密度,并在多次随访中,精准提示病情变化,并可评估患者的疗效及预后。目前研究结果显示,临床不同严重程度患者的肺部病灶百分比存在显著差异,且随着病情严重程度分级的提高呈递增趋势[9]。AI可用于监测疾病进展和了解COVID-19病灶的时间演变特征;同时也降低了放射科医师对治疗前后胸部CT影像比对的主观性,有利于准确评估患者治疗效果。
4.影像组学联合AI和临床信息应用:多项研究将首次就诊患者的临床、实验室和影像学资料建立预测模型,评估COVID-19患者的预后和预警重型及危重型患者,结果显示AI预测模型对早期发现重型及危重型患者,降低重型及危重型患者死亡率具有重要意义[10]。Sun等[11, 12]研究显示,单纯的影像组学、单纯的AI或单纯临床信息的临床应用价值均有限,影像组学联合AI和临床信息对COVID-19进行筛查,可提高AI诊断在真实临床场景的应用。目前报道的预测COVID-19患者死亡风险、进展为重症或住院时间的模型,无论是单纯的临床和实验室资料还是结合了肺炎病灶CT影像特征和病灶百分比,由于其入组参数差别较大,预测效果存在较大偏差,故这些预测模型要用于临床还有待进一步验证[13]。
借鉴临床诊断的思路,大多数COVID-19的AI产品首选从影像上找出与磨玻璃或实性结节等肺炎有关的征象,然后对肺叶、肺段进行分割,从而更精细地定位肺炎的位置,通过提取影像组学或深度学习特征进行辅助鉴别诊断。通常使用的分割模型主要包括UNet、UNet++、VBNet等编码解码网络。使用的定位分割方法包括神经网络如ResNet,以及传统的机器学习如支持向量机、随机森林等[14]。在肺炎区域分割方面,目前流行的监督学习算法需要对CT图像中的肺炎区域进行标注,以训练算法模型对新的图像进行自动分割[15]。
由于肺炎标注工作费时、费力,且COVID-19期间资源相对有限,很多研究者提出了相应的解决方案,如“人在回路”的方法[16]。该方法基于少量的数据和标注建立初始模型,将初始模型用于新数据的预标注,再由人工修改,从而大大节省时间。经过几轮的快速迭代,模型可以达到一定的性能。同时,少样本学习、弱监督学习、迁移学习和对抗生成都得到了应用[17]。为了获得好的鉴别诊断效果,神经网络方法通常将肺炎区域的分割结果作为多通道输入或是用于候选区域提取。最新的研究提出将肺炎作为注意力区域,通过损失函数限制网络关注的范围,对提高分类效果和网络的可解释性都起到了较好的效果[18]。
对于算法而言,许多算法尚存在有限的微改进创新以及与旧算法性能差别不大的问题。因此,对疫情期间提出的大量算法可以去粗取精,从而对领域内外的影像应用和AI产品研发提供帮助。目前国内外公开发表的关于COVID-19相关的基于CT影像的AI技术和产品见表1[19, 20, 21, 22]。

国内外公开发表的关于COVID-19相关的基于CT影像的AI技术和产品
国内外公开发表的关于COVID-19相关的基于CT影像的AI技术和产品
| 论文名 | 数据模态 | 发表期刊 | 开发团队 | 算法模型 | 临床应用场景 | 诊断效果 | 不足 |
|---|---|---|---|---|---|---|---|
| Development and evaluation of an artificial intelligence system for COVID-19 diagnosis[19] | DR+CT | Nat Commun | 清华大学,华中科技大学等 | ResNet152+UNet | 基于X线以及CT的COVID-19, 甲型流感/乙型流感,非病毒性肺炎以及非肺炎分类诊断 | 基于CT AUC为98.5%;基于X线AUC为95.3% | 仅用单模态影像数据 |
| Artificial intelligence distinguishes COVID-19 from community acquired pneumonia on chest CT[2] | CT | Radiology | 武汉市黄陂区人民医院;江汉大学附属黄陂人民医院等 | RestNet50 | 基于CT的COVID-19,CAP,非肺炎数据 | AUC为95% | 仅用单模态影像数据 |
| Artificial intelligence-enabled rapid diagnosis of patients with COVID-19[3] | CT | Nat Med | 西奈山伊坎医学院等 | Inception- ResNet-v2 | 基于CNN得到CT特征和临床信息结合实验室信息,对患者进行COVID-19的诊断 | AUC为92% | COVID-19数据较少;只使用少量基本的临床信息 |
| CT image visual quantitative evaluation and clinical classification of coronavirus disease (COVID-19)[4] | CT | Eur Radiol | 中山大学,中山大学第五附属医院等 | — | COVID-19严重程度分级 | AUC为91.8% | COVID-19数据较少;只使用单模态影像数据 |
| Multicenter cohort study demonstrates more consolidation in upper lungs on initial CT increases the risk of adverse clinical outcome in COVID-19 patients[20] | CT | Theranostics | 东南大学附属中大医院,北京大学等 | 3D UNet | 评估与不良复合终点(COVID-19)相关的影像学特征和危险因素 | — | 仅考虑影像因素 |
| Clinically applicable AI system for accurate diagnosis, quantitative measurements and prognosis of COVID-19 pneumonia using computed tomography[8] | CT | Cell | 澳门科技大学,四川华西医院等 | 3D ResNet-18, UNet等 | 基于CT诊断COVID-19以及非COVID-19,并且识别临床相关重要标志物 | AUC为96%~99% | 对于诊断任务,仅考虑CT影像因素 |
| AI augmentation of radiologist performance in distinguishing COVID-19 from pneumonia of other etiology on chest CT[21] | CT | Radiology | 中南大学湘雅医院,罗德岛医院等 | Efficient Net | 基于CT的COVID-19分诊 | AUC为90% | 只考虑影像因素 |
| Inf-Net: automatic COVID-19 lung infection segmentation from CT images[15] | CT | IEEE Trans Med Imaging | Inception,南开大学等 | UNet+Attention | COVID-19病灶区域的分割量化 | Dice为0.74 | — |
| A weakly-supervised framework for COVID-19 classification and lesion localization from chest CT[17] | CT | IEEE Trans Med Imaging | 华中科技大学同济医学院,华中科技大学等 | 3D ResNet | COVID-19的筛查 | AUC为95.9% | — |
| Adaptive feature selection guided deep forest for COVID-19 classification with chest CT[11] | CT+影像组学 | IEEE J Biomed Health Inform | 南京航空航天大学,吉林大学中日联谊医院等 | — | 结合组学信息和深度学习进行COVID-19分类 | AUC为96.35% | — |
| Classification of severe and critical COVID-19 using deep learning and radiomics[22] | CT+影像组学 | IEEE J Biomed Health Inform | 中国科学院自动化研究所,武汉大学人民医院等 | — | COVID-19严重程度分级 | AUC为86.1% | COVID-19数据较少 |
| Early triage of critically ill COVID-19 patients using deep learning[12] | CT | Nat Commun | 广州医科大学第一附属医院,腾讯等 | — | COVID-19危重患者的筛查 | AUC为89.4% | — |
注:COVID-19:新型冠状病毒肺炎;AI:人工智能;DR:直接数字化摄影;AUC:曲线下面积;CAP:社区获得性肺炎;CNN:卷积神经网络;Dice:字符串相似度
AI产品的研发不仅依赖于算法的提升,高质量的COVID-19影像训练数据库也是AI建模的关键。目前AI产品多基于合作单位单中心数据,样本量不足,缺乏外部及前瞻性验证。COVID-19算法研究中大多存在样本不平衡问题,主要来源于疾病影像表征多样性和CT扫描参数不一致。随着对COVID-19疾病的认知程度加深,多种多样的CT表现需要补充到训练集中。此外,各机构的CT设备并不统一,且CT扫描时的层厚、层间距、图像尺寸、图像重建方法等参数设置也各不相同,进一步增加了训练数据的内部异质性。因此,针对多样的CT影像特征及成像参数设置,收集足够多的代表性样本对提高模型的准确性和泛化性至关重要。
除了数据纳入的多样化,规范精准的数据标注亦是模型训练的关键因素。理论上,需对COVID-19病灶边缘进行精确勾画,并避开血管等非病灶区域,但常见的COVID-19肺炎病灶多呈片状影,其边界往往模糊不清,人工勾画病灶进行图像分割标注具有强烈的主观性,可重复性差,这将影响肺炎图像分割AI算法的性能,并对后续的定量分析、严重程度评级等带来直接的不利影响。
国际上现有多个COVID-19影像的公开数据集,然而这些公开数据集样本量少,图像质量低,难以满足可靠的AI模型的训练需求。例如,加拿大Montreal大学将公开发表或者预印本论文中出现的X线片通过抠图技术导出,构建出X线COVID-19数据集,但论文制作成pdf时图像分辨率等质量已大为下降。意大利医学与介入放射学会公布了110例CT图像,但该数据集并非DICOM格式,而已转换为JPG格式,丢失诸多可用信息。BSTI(British Society of Thoracic Imaging)也公布了一个公开数据集,但该数据集仅限于教学及在线浏览,不能下载及用于科研。
随着COVID-19疫情正产生越来越多的医疗数据,对大量数据进行数据规范化采集和质控管理,构建COVID-19标准数据集成为重中之重。构建的数据集应当充分考虑数据来源的多样性,且数据集应具有代表性并包含疑难样本。需要的考虑多种因素,包括:(1)数据来源多元化。如来源COVID-19高风险区和非高风险区的多家、不同地域、不同层级的代表性临床机构及来自多种、不同采集参数的采集设备等。(2)数据内容多样化。数据内容包含临床数据、仿真数据和体模数据等。(3)数据格式规范化。对数据格式、数据传输协议、数据预处理、数据集设计、数据集质量管理与评价等方面建立标准规范。(4)数据标注标准化。对数据标注规则、标注流程设计、标注人员管理、过程质控等方面建立标准规范。
迄今为止,已有9项基于COVID-19的AI产品或模型进行智能分诊或预警、预后评估的临床试验通过了中国临床试验注册中心在境内的注册。目前的临床验证研究方法大多数为回顾性研究,纳入的阳性病例均为呼吸道标本核酸检测阳性和(或)CT显示病毒性肺炎的患者,且均为诊断性试验,与设置的金标准或目标值进行对比假设检验,观察指标主要为灵敏度、特异度、曲线下面积、准确度等。
国家药品监督管理局医疗器械技术审评中心在2020年3月5日发布了首个审评监管层面的指导性法规文件《肺炎CT影像辅助分诊与评估软件审评要点(试行)》(2020年第8号)。详细阐明了对该类产品研发及临床试验的要求,如在研发过程中,规定了训练样本量、CT影像、数据分布及有关算法等要求;在临床试验方面,对试验目的、试验设计、受试对象、评价指标、金标准构建、样本量及统计学方法等均做出详细说明与要求;对进一步规范我国肺炎AI产品的研发、临床试验路径与合法申报注册等均具有重要的指导作用。
此外,COVID-19的AI产品临床试验还面临较多的挑战,主要体现为:(1)我国COVID-19疫情基本平稳,COVID-19患者已治愈出院,无法设计和实施前瞻性试验;同时对回顾性诊断试验来说,由于疫情暴发阶段同时开展的AI产品研发试验过多,致使入组患者的质量与数量不佳,可能对试验结果产生一定的偏倚。(2)在AI产品独立性能的验证中,诊断试验为单臂试验,未设对照组,故金标准要求很高,对专家诊断能力和临床经验提出很大挑战;同时依据COVID-19最新诊疗方案,确诊病例须符合流行病学史和临床及实验室表现,而许多医院有时难以获得准确流行病学史与及时的实验室结果,可能导致延误诊断。(3)在选择临床试验机构时可能存在多家AI公司选择同一家医院,导致患者数据重复使用;同一家医院也无法承接多个类似临床试验项目,这些问题均需国家有关机构进行顶层设计和统一指导。
综上所述,本次疫情为医疗AI技术提供了真实世界的落地场景,COVID-19的AI软件研发应用,也得到了临床实践的认可。同时,也存在一些不足,如对COVID-19肺部炎性病变识别灵敏度高但特异度低;对早期病灶、合并有胸腔积液以及吸收期病灶分割不够精准,存在漏诊或测量不够准确等,需要进一步调优模型。新的AI技术的创新将是AI发展的原动力,从而对AI产品研发提供帮助。
后疫情阶段,现有COVID-19的AI模型应进一步训练多种类肺炎数据,并纳入临床资料,建立AI筛查预警系统,在公共卫生事件防控中提供更全面的应用。同时,阻碍医学影像AI技术发展的老问题,如高质量医疗大数据的获取与规范标注、数据归属与开放应用、产品准入要求等也进一步引起了政府部门的重视,有望在后期得到规范的解决。
所有作者均声明不存在利益冲突





















