
随着计算机计算能力的提升以及数据储存终端的容量扩展,人工智能(artificial intelligence,AI)技术在近年来得到飞速发展。同时,随着医疗水平的提高,眼底病变已经逐渐成为失明的主要病因。眼底图像是眼底疾病诊疗中重要的信息来源,同时因数字化的优势,使AI能够通过学习而自动化地对大样本的眼底图像数据进行分析,在眼底疾病的识别方面已经初步展现了高效性与准确性。利用AI以应对不断增加的致盲风险疾病所带来的公共卫生挑战已经成为眼科学发展的重要趋势。本文综述了AI的基本原理以及其当前在眼底图像分析中的应用情况和前景展望,以期为今后AI在眼科领域的深入应用提供更系统的思路。
本刊版权归人民卫生出版社有限公司所有。任何机构或个人欲转发本刊图文,请与本刊联系。凡未经授权而转载、摘编本刊文章者,本刊将保留追究其法律责任的权利。
据估计,全球有超过20亿人受到不同程度的视力损害,中重度损害乃至失明者多达2亿人[1]。包含年龄相关性黄斑变性(age-related macular degeneration,AMD)和糖尿病性视网膜病变(diabetic retinopathy,DR)在内的眼底病变被世界卫生组织列入了致盲的主要病因。2020年国家卫生健康委员会发布的数据显示,眼底疾病已成为重要的致盲性疾病。眼底疾病的防治俨然已成为一个亟待解决的流行病学问题,而临床医生尤其是眼底专科医生的数量远不能满足目前公共卫生需求,非常需要一种全新的辅助技术以优化诊疗和决策过程。
人工智能(artificial intelligence,AI)技术,作为计算机科学的一个分支,旨在创造能再现人类智能技术的机器。其在医学领域的应用可追溯至20世纪70年代,但由于早期的AI主要依赖人为编译计算规则,其应用范围在较长一段时间内都较为局限。当前,计算机计算能力的提升以及大样本数据库的建立拓宽了AI的使用前景,亦为发现新的医学规律提供了可能。
眼底疾病的诊断高度依赖于眼底图像。传统的眼底图像分析主要依靠人工比对异常眼图像相较于健康眼图像的特征性区别。而AI通过对数据库进行大数据学习,能深入到亚临床的层面分析疾病特征,以整合的形式在人群大样本的基础上分析异常眼底图像的特点,并以个体化的方式分析相应患者的治疗及预后[2]。因此,临床实践中AI技术的引入意味着眼底疾病诊治方法的转型。本综述就AI的基本技术原理以及其当前在眼底图像领域的应用展开叙述,以期为该技术在临床医学应用中的进一步拓展提供一定的参考。
AI可以模仿中枢神经系统的神经元结构来建立用于机器学习的神经网络,这一模式被称为深度学习。当前,常用的神经网络有以下3种类型:深度神经网络(deep neural networks,DNNs)、循环神经网络(recurrent neural networks,RNN)及卷积神经网络(convolutional neural networks,CNNs),其中CNNs最常用于图像信息的处理[3]。该神经网络的编译与联结方式类似于哺乳动物大脑皮质的视觉区域。其包含的每个卷积核只识别各自特定的信号,这一过滤作用使卷积核扮演了在输入图像上识别特定标志的角色,若干卷积效果的结合使得CNNs能够更成熟地提炼图像并加以分析[4,5]。
当前应用于眼底图像领域的AI学习模式主要有两种类型(图1),即传统的机器学习和深度学习[6,7]。传统的机器学习建立的映射模型所需要执行的步骤较短,其工作主要是识别和处理人为选取的特征性图像标志,进而输出结果。由于算法内容复杂性较低,传统的机器学习通过结构简单的算法网络便能建立。其对图像分析的准确性受制于人为设定的图像标志对疾病的分辨能力,相较于深度学习,其优点在于通过较小的数据库,相对少量的训练即可达到预期水平[8]。相较于传统机器学习,以CNNs等神经网络为载体的深度学习模式则更为复杂。该学习模式不再局限于人为预设的图像特征性标志,而是不断通过从图像到结论的训练使得AI能够建立起自己的内在分析机制,而其缺点在于所需的训练量大,需要大型数据库的支撑。在这一背景下,深度学习的模型构建除从零开始搭建外,还可由已经建立好的,用于解决其他任务的模型,通过对目标任务进行学习,将之训练为工程师需要的模型,该方法被称为迁移学习,其所需的设计时间成本和训练样本相对较小。借助这一模式,研究者能够在前人的基础上,通过仅不到原本所需数据量1/10的眼底图像,即可完成深度学习模型的构建[9,10,11]。


眼底图像分析领域的AI当前已广泛应用于眼底特征性标志的检测与量化、眼底疾病的筛查、眼底疾病的分级和临床决策的制订,并随着AI应用模式的逐渐成熟开始呈现出多模态化、多病种化的趋势。
就眼科学而言,当前基于CNNs的AI系统最常用于眼底彩照(colorful fundus photograph,CFP)中眼底病变相关标志的检测。然而,为使检测结果具有临床参考价值,并结合AI分析在诊疗过程中的使用场景,自动化地判断每张CFP是否合格,是AI分析的第一步。这一工作通常建立在检测眼底的生理性标志,即重要解剖结构的基础上。AI利用眼底解剖标志如视网膜大血管、视盘、黄斑中心凹等建立一个审视框架,使得合格的图像能够以正确的摆放方位接受检测[6,12]。除上述生理性标志的检测外,病灶的特征标志分析也至关重要。结合AI所识别的生理结构和疾病病灶,AI能够精确分辨图像噪点并将之去除,以实现模糊图像的增强[13]。以AMD为例,目前通过传统机器学习对AMD进行风险评估,已经能够达到专家评估的水平[14,15]。而利用深度学习训练的AI系统能够在识别眼底图像上的特征性病灶后,自动划分病灶的大小、数量,以进一步呈现疾病的全貌[16,17]。
眼底疾病的筛查是采用高效、便利的手段实现大样本人群的检测。眼底疾病的筛查中,理想的AI辅助筛查系统应做到可以早期发现致盲征象(如AMD中的新生血管)并及时处理以防止不良预后的发生。利用AI进行筛查的目的是期望能用高效、便利的手段实现大样本人群的检测。在这一理念下,早期受限于算法模型经验偏少和计算机算力的欠缺,基于AI的眼底疾病的筛查多聚焦于发病率高、眼底表现典型的单一病种,如DR和AMD[18,19,20],并逐步扩展到早产儿视网膜病变等病种[21,22,23]。随着AI应用技术的进一步成熟,当前AI已成功实现了针对单一眼底图像的多病种同时检测。在2022年Dong等[20]发表的文献中,基于120 002张CFP训练的AI模型能够实现在一张CFP上同时完成对包含AMD、DR、视网膜色素变性、高血压视网膜病变、黄斑前膜在内的等多种眼底疾病的筛查,并在AMD及高血压视网膜病变等疾病上达到超过高年资眼底专科医师的水平。
眼底疾病分级是在筛查基础上AI在眼底图像分析中的进一步应用。当前,基于CFP的AI模型已能够同时完成DR的筛查和分期,其准确率超过95%[24]。而对于AMD,其进展阶段需要通过光相干断层扫描(optical coherence tomography,OCT)的图像来判断[25]。Venhuizen等[8]的研究中,AI在将AMD划分为5个阶段(无AMD、早期AMD、中期AMD、晚期AMD伴地图样萎缩及晚期AMD伴脉络膜新生血管)的任务上达到了98%的灵敏度和91%特异度。Tang等[26]建立的AI模型,成功按照病理性近视研究组Meta分析分型将病理性近视患者的眼底图像分为5类,受试者工作特征曲线下面积0.998 0。在眼底疾病外,AI在基于眼底图像的青光眼分级上也有较广泛应用[27]。
AI的另一优势在于能够迅速对既往病例(包括检查结果、临床处理以及治疗预后)进行大规模的学习与分析,以辅助制定诊疗及随访方案。对于需要积极手术干预的疾病,如黄斑裂孔,Xiao等[28]建立的AI模型,通过对330例患眼术前及术后的OCT图像和病史信息进行学习,能基于术前OCT图像生成预后相关热点图,精准定位全层裂孔中与手术预后相关的区域,为手术方案选择提供了参考依据。而对于需要长期随访并调整治疗方案的疾病,如湿性AMD,个体化规划复查随访间期的AI系统得到了初步应用。在一项多中心研究中,研究者使用317例患者的数据进行了模型训练,AI通过深度学习技术对患者的OCT数据进行学习,并借助传统机器学习技术对患者的治疗转归进行学习。这一模型在AI技术灵活应用的基础上,成功将患者对随访的需求程度分为了低需求、中需求和高需求3组[29],既减少了低危患者过度就诊对医疗资源的浪费,又同时尽可能避免高危患者就诊不及时对视力预后的损害。
早期的研究中,AI对疾病的判断多基于单一模态的图像数据,即仅仅依靠OCT或CFP来对图像所反映疾病作出预测。该识别模式虽便于计算机模型的构建,但与临床实践模式不符——依靠一种检查更容易遗漏疾病的重要信息,而不利于AI判断的准确性[30]。近年来基于两种模态甚至是多种模态的AI研究越来越多,AI结果的准确性也越来越提高。Kihara等[31]利用视盘近红外(infrared reflectance,IR)图像结合视盘OCT图像建立视野缺损的AI预测模型,其准确性显著高于仅依赖IR图像或OCT图像的AI模型预测结果。而Yang等[32]也验证了基于OCT和CFP两种模态眼底图像的AI模型较之于仅依赖OCT或CFP的单一模态AI模型在多种眼底疾病(包括DR、AMD等疾病)诊断方面的更高准确性。考虑到眼底病变,尤其是慢性病变,多与全身其他系统疾病存在着一定的关联,将眼底图像识别的多模态化进一步推向全身数据的多模态化会更加充分地利用患者检查信息,进而有效提高AI的诊断准确性。杜克大学团队开发的AI系统,在借助了OCT和眼底自发荧光图像(fundus autofluorescence,FAF)等两个眼底图像模态的同时,结合了患者性别、年龄、视力和受教育程度等非图像模态的信息,进而更加综合地进行阿尔茨海默病的诊断[33]。Yoo等[34]则综合CFP和视力、眼压、全身疾病及激素使用情况等全身信息,建立了预测中心性浆液性脉络膜视网膜病变接受光动力疗法的预后预测模型。
视网膜是全身唯一可以直观看到血管的神经血管组织,多种全身性疾病在眼底均有所表现,以眼底图像来评估全身健康情况、预测全身疾病的存在以及严重程度是AI研究的一个方向。来自斯坦福大学的研究团队借助转化学习的方法,构建了一系列基于CFP预测全身多项参数的AI模型,其在患者种族、性别、血管紧张素转换酶抑制剂和血管紧张素受体拮抗剂的使用情况上取得了较高的预测准确性[10]。Rudnicka等[35]则借助3D-OCT数据,使用AI提取并分析了视网膜小动脉和静脉的宽度、弯曲度和面积,提高了心血管死亡风险预测模型的准确性。借助CFP图像上的血管形态、OCT图像上的神经纤维层厚度变化等参数,基于眼底图像的心脑血管与神经系统疾病无创评估AI模型进一步提高了眼底图像的应用价值[36]。
自然语言处理技术(natural language processing,NLP)是一门使计算机能够理解、生成和评估人类语言的计算机科学技术,其多年来都受制于语言的多样性、复杂性和不确定性,因而长时间未能在眼科学领域受到重视[37]。NLP技术根据其依赖人为编辑的词条库还是通过深度学习生成语言,可分为基于规则的NLP和基于深度学习的NLP。随着基于AI的NLP的兴起和计算机算力的提高,近年来,NLP在眼科学领域的应用取得了显著进展:NLP目前已应用在眼科非结构化病历的信息提取、眼科文献总结和医嘱用药安全性的审核等方面[38,39,40]。利用眼底图像自动生成诊断报告的AI模型,相较于普通的AI识别模型,能够进一步说明眼底图像上病灶、病种的位置、范围和数量,将眼底图像的识别结果从简单的标签转换为有意义和可解释的信息,进一步提高AI在眼底图像处理上的实用性,并可推广到缺乏专业眼科医师的地区[41]。但当前的诊断报告生成模式尚停留在基于规则的阶段,利用深度学习生成建立不受限于人为编辑词条库的生成模型能够进一步扩大该模式的应用面,是今后的研究方向。
如何将AI的功能从单纯的疾病识别进展到切实参与疾病诊治工作,是未来的发展方向之一。近年来,AI在眼科手术方面的应用也在逐渐取得进展:基于术前OCT图像的深度学习模型,已经能在黄斑裂孔和黄斑前膜等疾病手术治疗的预后预测上取得超过0.8的灵敏度和特异度[28,42,43];通过对眼底手术录像的学习,AI已经能完成术中的手术器械识别、动作轨迹识别和分割以及手术步骤识别,进而完成手术技术的评分,这一方面有利于眼科医生的技能教学,也为AI同步参与到眼科手术中打下了基础。由He等[44]开发的手术稳定系统,能识别眼科医师操作中的"安全"和"不安全"应力,并驱动机械臂减弱"不安全"应力,进一步参与到了眼科手术治疗之中。此外,新兴的基于深度学习的眼内机器人介入系统也已完成了离体猪眼的晶体摘除[45]。
AI技术的发展给临床实践工作带来了巨大的革新,临床医生利用数据库开拓医学知识的进度迅速提升[46]。通过AI将眼底图像中既往容易忽视掉的临床指标纳入疾病分析是提高图像临床诊断价值的重要方法,临床诊断所需要综合考虑的因素也更加多元化[47]。目前AI已经在多个学科疾病如眼科学、皮肤病学、影像学以及病理诊断学中得到了广泛的应用[47,48]。
尽管AI的应用领域正逐步扩展,其依然存在几个不可忽视的问题。首先,AI的训练依赖于数据库的构建,而在DR、AMD以外,充分标注、分级的大规模眼底图像数据库仍然较少;其次,深度学习存在"黑箱"问题,即基于深度学习的AI所进行的是从图像到结论的工作,以人的角度往往无法了解AI得出结论的实际依据,像素遮蔽等方法可以辅助人为解读AI的判断逻辑,但该方法所需时间、人力较大[49];最后,眼底图像存在人为无法察觉的"伪影",即部分像素点的改变虽然肉眼无法识别,但可能影响AI的输出结果[7]。
在面对上述挑战的背景下,新的进展方向为AI在眼底图像应用领域的价值进一步深化。NLP技术的引入是为了更高效地传递信息,而AI参与手术工作则能使AI更深入地参与医疗工作。上述方向的技术进展,将有利于AI融入眼科诊疗的各个阶段,提高医疗效率和质量。因此,在巩固当前已有成果的同时,探索新的AI应用类型和场景,并不断解决其带来的挑战,是今后医学领域的关键任务之一。





















