
目前,消化内镜是医学人工智能(AI)研究的热点领域。在AI和大数据迅猛发展的背景下,AI利用多组学大数据辅助炎症性肠病(IBD)疾病活动度评估和治疗决策已成为IBD诊疗的新方向。本文主要就AI在IBD内镜诊治中的最新研究进展进行综述。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
炎症性肠病(inflammatory bowel disease,IBD)是一种病因未明的慢性非特异性炎性疾病,主要包括溃疡性结肠炎(ulcerative colitis,UC)、克罗恩病(Crohn′s disease,CD)和未定型肠炎(IBD-unclassified,IBD-U)。结肠镜检查是IBD诊断和鉴别诊断的重要手段和工具,但它具有较大的主观性,并且受到观察者间和观察者内差异的限制[1]。为解决这一问题,研究者开发了一些内镜下疾病严重程度评分系统,主要包括梅奥内镜评分(mayo endoscopic score,MES)、溃疡性结肠炎内镜严重程度指数(ulcerative colitis endoscopy index of severity,UCEIS)和克罗恩病简易内镜评分(simple endoscopic score for Crohn′s disease,SES-CD)等,以便于内镜下疾病活动度评估更标准化和均质化。然而,在临床实践过程中,观察者之间仍存在相当大的差异,许多内镜医生对病变诊断的能力和准确性也有待提高,因此,如何做到内镜评估的标准化和均质化,是目前临床亟待解决的问题。近几年人工智能(artificial intelligence,AI)技术突飞猛进发展,极大推动了医学领域的变革。它可以实时评估大量数据,并预警临床医生可能忽视的细节,从而提供更准确和客观的进行内镜诊断和评估[2]。在IBD领域,AI可以通过机器学习(machine learning)来模拟和复制专家判断和预测临床结果,而且重复性良好,在内镜诊断、评估疾病活动性和严重程度或并发症方面已有不俗表现。本文主要就AI在IBD内镜领域的应用进展进行阐述,以期为未来AI在IBD内镜领域应用的探索提供思路和参考。
AI辅助内镜检查基于计算机算法,这种技术的基本原理是"机器学习"[3]。机器学习是迈向AI的重要一步,使计算机能够从大量数据中预测结果。算法是所有机器学习的基础,在机器学习中,算法是使用这些数据的规则。机器学习可以利用这些规则来寻找输入数据和输出数据之间的关系。简言之,机器学习是指计算机利用训练数据、经过不断自我学习、训练后导出模型,并使用测试数据来评估模型。如果模型满足所需性能,则可用于其他测试数据。否则,就会调整算法、优化模型,并再次进行评估,直至该模型获得所需的性能。
目前已有许多不同的机器学习方法,其中最流行的是使用人工神经网络(artificial neural network)[4]。人工神经网络基于多个相互连接的算法层,这些算法以特定的模式处理数据并提供数据,以便系统可以被训练来执行特定的任务。从机器学习的神经网络子算法分支的一系列成果经过不断发展,形成了一种更加智能和通用的模型——卷积神经网络(convolutional neural network)[5]。卷积神经网络是当今图像识别的主流技术,对实现AI分析IBD内镜图像十分重要。
AI在IBD领域最早的应用之一是尝试进行CD和UC的诊断与鉴别诊断。Mossotto等[6]利用内镜数据、组织学数据以及内镜和组织学数据联合,建立了3个监督学习模型,准确率分别为71.0%、76.9%和82.7%;并且将内镜和组织学数据联合的模型用于来自同一诊所的48例患儿的独立队列中进行测试,结果提示鉴别UC和CD的准确率约83.3%。Quénéhervé等[7]运用共聚焦激光显微镜检查,并基于14个功能和形态参数建立了一个评分模型,以对黏膜结构进行定量分析,诊断IBD的灵敏度和特异度接近100%;鉴别诊断CD和UC的灵敏度和特异度分别为92.3%和91.3%。一项来自中国5个中心的研究,基于1772例患者和49 154张结肠镜检查图像数据集,开发了一个卷积神经网络模型以辅助IBD临床诊断,结果显示该模型诊断准确性优于内镜医师,甚至优于经验丰富的内镜医师(卷积神经网络比实习内镜医师:99.1%比78.0%,P<0.001;卷积神经网络比经验丰富的内镜医师,99.1%比92.2%,P<0.001)[8]。此外,一项研究基于211例CD、299例肠白塞和217例肠结核患者,共6617张结肠镜图像(包括具有每种疾病典型特征的典型图像,以及假性息肉、结节等非疾病典型特征的其他图像),运用卷积神经网络开发了一个诊断模型,结果提示该模型能很好鉴别上述3种疾病,并且对典型图像有很强的识别能力(其他图像比典型图像:65.15%比72.01%,P = 0.024)[9]。
由于IBD疾病表型的异质性,临床实践中IBD的诊断仍存在较大挑战,尤其当某些患者病变局限在结肠,且既具有UC又具有CD的某些特征时,诊断的准确性对后续诊疗及预后有极大的影响。AI在IBD诊断和鉴别诊断中展现出了非凡的潜力,未来有望在疑难IBD诊断中大放光彩。
如前所述,内镜检查在IBD的诊断及疾病活动度和预后评估中有重要作用。目前已有许多AI应用于UC内镜下活动度评估的研究,并且已显示AI具有媲美专家评估UC内镜图像的能力。
Ozawa等[10]基于GoogLeNet架构构建了一个计算机辅助诊断(computer-aided diagnosis)系统,该系统使用来自841例UC患者的26 304张结肠镜图像进行训练,结果提示经过训练的计算机辅助诊断系统在区分内镜下缓解(MES = 0,1)和疾病活动(MES = 2,3)方面表现出色,受试者工作特征曲线下面积(area under the ROC curve,AUC)为0.98。Stidham等[11]重复了这个研究,他们利用来自大约3000例UC患者的16 000多张图像开发了一个神经网络MES模型,用于区分内镜缓解(MES=0,1)和疾病活动(MES = 2,3),其AUC、灵敏度和特异度分别为0.97、0.83和0.96。在最近的一项试点研究中,Yao等[12]构建的计算机辅助诊断系统用于全程动态评估内镜检查的MES,其在51个高分辨率视频和一组多中心临床试验(包括264个视频)上进行MES评估的准确率分别为78%和83%。此外,Gottlieb等[13]利用生物制剂mirikizumab二期临床试验的完整内镜视频,开发了一项计算机辅助诊断系统来确定MES和UCEIS评分,结果显示所建立的模型与专家判读之间具有很好的一致性。Fan等[14]利用332例UC患者的5875张内镜图像以及20个结肠镜检查视频,建立了一个新颖的卷积神经网络模型,该模型不仅出色地完成了对肠镜图片的MES和UCEIS评分,还可以完成全肠道内镜检查动态视频的评分,并且在单个内镜图像的评估能力方面与有经验的内镜专家相当。
以上这些结果支持AI被训练后可用于评估UC患者静态内镜图片及肠镜检查过程中动态视频的肠黏膜炎症程度。除此之外,AI还能扩展传统内镜的能力,即在无需活检的情况下进行组织学评估并预测预后情况。Maeda等[15]使用一种新型的超扩大细胞内镜(endocytoscopy)开发了计算机辅助诊断系统,评估UC患者的组织学愈合情况,回顾性分析187例UC患者的数据,包括6个结直肠节段(盲肠、升结肠、横结肠、降结肠、乙状结肠和直肠)的超扩大细胞内镜图像和活检标本,并利用87例患者的12 900张超扩大细胞内镜图像用于机器学习来构建计算机辅助诊断系统,另外收集100例患者的525个独立肠段作为验证集,结果显示该计算机辅助诊断系统的敏感性、特异性和准确性分别为74%、97%和91%,并且具有良好的重复性。需要指出的是,超扩大细胞内镜检查需要医生有较高的病理学诊断能力,并且该设备价格昂贵,限制了其在临床实践中的应用。
Takenaka等[16]使用40 758张并带有6885个活检结果的结肠镜图像,构建一个深度神经网络(称为DNUC)用于UC评估,在纳入875例UC患者的前瞻性研究中验证其准确性,结果表明判断内镜下缓解(UCEIS评分为0)的准确率为90%,组织学缓解(Geboes评分<3)的准确率为93%,并且AI和IBD专家在UCEIS评分方面的一致性很高,相关性为0.917。此外,该团队开展的另一项前瞻性队列研究评估了DNUC的预测预后价值,结果显示AI评估黏膜愈合(定义为内镜和组织学均缓解)与后期发生不良事件(包括再住院、接受结肠切除术、类固醇使用和临床复发方面)的风险显著降低相关(P均<0.001)[17]。由于DNUC算法是采用来自单中心的数据以及静态图像构建的,因此需要多中心前瞻性研究来进一步验证该系统的准确性。
Gui等[18]也开发出一种利用简化的组织学评分来准确预测UC组织学缓解的AI模型,这是一项基于帕丁顿国际虚拟染色内镜组织学缓解指数(仅基于中性粒细胞的存在情况)的前瞻性多中心研究,利用307例UC患者的614份活检结果构建一个模型,结果发现帕丁顿国际虚拟染色内镜组织学缓解指数1分可准确预测患者12个月内发生不良结局(住院、结肠切除术和因复发而优化治疗)的风险,并且阅片者之间具有高度一致性(组内相关系数为0.84),区分活动期和缓解期UC的灵敏度、特异度和准确度分别是78%、91.7%和86%。
CD内镜下病变形态和解剖学上极大的异质性给当前使用AI进行图像分类带来巨大挑战,以至于运用AI在常规内镜下使用SES-CD和CDEIS一直受到限制。相比之下,目前AI在CD中的应用主要是胶囊内镜下检测及评估小肠溃疡病变。Klang等[19,20]在胶囊内镜图像上训练的人工神经网络可检测出近95%小肠溃疡,并识别出非梗阻性狭窄。Barash等[21]开发了一种溃疡检测系统,可以识别不同程度的溃疡。而Ding等[22]在一项多中心研究中发现使用AI方法检测胶囊内镜中的溃疡时,平均审查时间从96.6 min减少至5.9 min,并且没有增加病灶漏检率。用于CD病变检测和分类的卷积神经网络也应用于同时检查小肠和结肠的胶囊内镜系统。在这一过程中,AI技术提高了诊断效率,并且缩小了观察者之间的差异[23,24]。
上述研究也具有局限性,首先,它们主要都是基于单个图像,而非采用完整视频,因此难以提供对胶囊内镜结果的整体评估。此外,这些都是回顾性队列研究,未来需要在多中心前瞻性队列中验证。尽管CD的异质性为AI的应用带来了挑战,但我们相信,未来随着AI技术的发展,这一瓶颈问题可以得到解决。目前至少在减少审查胶囊内镜的时间、提高诊断效率及缩小观察者之间的差异方面,仍然具有较高价值。
鉴于IBD患者发生结直肠肿瘤的风险增加,结肠镜在监测异型增生中具有十分重要的地位。日本已有成熟的EndoBRAIN系统在普通人群中运用,以高精度识别肿瘤性息肉和非肿瘤性息肉,但应用AI辅助监测IBD患者结直肠肿瘤的报道还很少[25]。由于炎症对肠黏膜外观的影响,使得UC相关性异型增生及结直肠癌较难诊断。在两项病例报告中,研究者发现利用EndoBRAIN系统可以帮助发现长病程UC患者的高度不典型增生[26,27]。这些经验提示AI在监测IBD相关结直肠癌方面具有巨大的潜力。
消化内镜是医学AI研究的热门领域,国内外正如火如荼地开展相关研究。AI将在IBD消化内镜掀起一场革命,有望解决我国目前面临的内镜检查需求量大、人均内镜医师不足、检查质量参差不齐、病灶漏诊以及培训成本高昂等问题。但目前大多数研究仍处于探索阶段,尚未推广到实际临床应用中,且面临着数据稀少、算法透明度不足、质量标准不统一、伦理问题、黑盒模型可解释性等严峻挑战。相信随着科学技术的不断发展和行业进一步规范,在不久的将来,AI将深刻影响内镜下IBD疾病活动评估和治疗决策的选择,并极大提高消化内镜质量,改善患者预后。可以预见,在AI和大数据迅猛发展的背景下,未来前景是利用内镜数据和临床信息,并整合多组学包括基因组学、转录组学、蛋白组学、代谢组学、微生物组学等大数据,进行疾病精准分型,构建开发用于诊断、鉴别诊断、评估疾病和监测IBD的算法,以期对个体疾病特征有一个完整和精准的确定,做到精细化分型和精准化管理,以获得更好预后。
所有作者均声明不存在利益冲突





















