近年来随着深度学习、机器学习算法、硬件水平和数据库的提升,人工智能(AI)技术迎来第三次发展热潮,并为临床工作提供有力辅助。本文回顾整理了国内外AI应用于医学领域的相关经验,并结合最新研究文献及循证医学依据,重点介绍了在AI技术辅助下预检、病情评估、医学诊断、方案决策、外科手术、麻醉、护理、康复治疗、药理研究和医药开发等传统医学模式发生的巨大变革,旨在为国内临床医师全面介绍相关领域的概念与现状,并为AI未来在医学领域中的发展做出参考。






人工智能(artificial intelligence,AI)技术被誉为是继第一次工业革命(蒸汽革命)、第二次工业革命(电气革命)、第三次工业革命(计算机革命)之后的第四次工业革命的核心驱动技术之一。21世纪以来,AI技术取得一系列突破性进展,同时逐步渗入至医学行业之中,为医疗模式带来革命性的改变[1, 2]。本文广泛参考国内外相关领域中AI医学应用的最新研究文献撰写了此综述,旨在为广大临床工作者全面介绍AI在医学中的应用现状及展望,以期推进AI技术在医学领域中新的发展。
AI技术在20世纪50年代由“AI之父”——Alan Turing所提出:机器可以拥有类似人类智能的算法,并且通过模拟训练后甚至可以超越人脑,其发表的《计算机与智能》(Computing Machinery and Intelligence)一文正式提出了AI的早期概念[3]。历史上,AI技术的发展曾经历过两次热潮[4]:第一次热潮(1956—1966年),即AI概念诞生的初期,这一阶段在AI定理证明、计算机算法语言设计方面形成了较多突破;第二次热潮(1975—1990年),这一阶段提出了建立AI专家系统和知识工程的研究方向,并且热点逐步聚焦在“机器学习(machine learning,ML)”的研究方面。ML是实现AI的技术关键,它能模拟人类智慧对现有数据库解析、分析、获得信息并智能判断,是赋予计算机智能的根本。但受限于当时落后的计算机硬件、数据库规模和算法算力等条件,ML这一根本技术一直无法被良好实现,整个AI的发展一度进入寒冬。21世纪以来,随着计算机技术和信息技术的更新换代,“深度学习(deep learning,DL)”的概念被提出,DL算法是通过模拟构建人类大脑思维方式的神经网络机制,能够通过深度神经网络提升ML模型的效能,实现对数据库的深度挖掘和解释,如卷积神经网络(convolutional neural networks,CNNs)为其代表性算法。DL算法的产生使ML得到了更好的实现,因此AI技术在21世纪迎来了第三次发展热潮,目前已形成了以计算机视觉、自然语言图像识别、大数据统计分析、专家决策系统及智能机器人为主的多元化技术方向[1],这些技术方向同时也被逐步应用到了医学领域中,为医学行业带来了巨大革新,有了AI技术辅助传统医疗模式也发生改变,形成了一系列新型诊疗思路。
我国各级医院急诊普遍存在患者病情危重、急诊科医师不足等情况,急诊患者候诊时间长、风险大。并且由于医疗资源相对匮乏,急诊科医师工作负荷重,短时间内难以对患者形成全面、准确的预检分流及病情评估。目前各医院急诊科通常使用美国急诊严重度指数(emergency severity index,ESI)和英国曼彻斯特预检标尺(Manchester triage system,MTS)对患者病情进行危重度判断和预检分诊,然而由于患者个体化差异大、医疗人员个人经验占比高等问题,目前急诊患者的评估工作尚存不足。随着AI技术的突破,DL算法模型能够基于急诊数据库建立临床决策智能系统,实现对患者智能预检、病情评估,弥补了急诊科的现状[5]。在急诊患者病情评估方面,Fernandes等[6]收集了既往使用MTS进行评估的235 826例急诊患者临床资料建立起数据库并以此训练ML算法模型,通过最佳性能优化,该模型的曲线下面积(area under curve,AUC)达到0.96,能够精准预测患者的格拉斯哥昏迷评分、血氧饱和度,实现了高危患者的智能检出,加强临床护理工作开展[7]。同样,早期智能预警评分系统TREWS通过对81 520例急诊患者变量分析后,成功对患者入院后各时间节点的死亡率风险作出预测,为加强高危患者的护理提供参考。在智能识别急诊危重患者方面,Joseph等[8]通过对445 925例急诊患者(其中危重者60 901例,占比13.7%)的临床数据对DL算法进行学习训练后,最终AUC达到0.851,能够自动识别危重患者并预警,因此急诊科医师可以有选择性安排就诊顺序,对患者的生命健康提供了有力保障。这样的AI技术辅助预检、病情评估的模式,能够为医疗人员提供参考,减轻急诊科工作负荷,优化医疗资源再分配,提高患者诊疗效率的同时降低不良事件发生率及医疗资源浪费,为急诊患者的救治工作带来极大辅助。然而需要注意的是,由于部分危重患者临床特点不典型,也可能误导AI算法错误评估、识别患者情况,因此AI技术辅助急诊预检、病情评估工作的最后一步仍然需要医学专家判决,避免发生医疗事故。
患者就诊后常产生大量影像、病理、超声、内镜、检验等数据供临床诊断参考,因此如何通过这些庞大的数据作出精准诊断尤为重要。而在临床检查、检验等医技科室同样存在医疗资源不足、高年资医师匮乏等问题,面对海量的临床数据难以快速诊断,加之患者个体化差异大、检查结果不典型、假阴性等问题,高临床工作负荷下医师常有漏诊、误诊可能,这对患者的临床诊断十分不利。AI技术辅助医学诊断,经训练后能对临床数据进行智能诊断,有效解决了这一问题[9]。
在影像科,X线、CT、MRI是常用的检查手段,断层扫描产生的庞大影像资料需要影像科医师付出大量精力判读,目前已有多项研究基于DL算法建立了AI模型识别影像资料来解决这一问题。以肺部肺结节疾病的诊断为例,Yoo等[10]通过对5 485名吸烟者的胸部X线分析后设计了DL模型,通过训练该模型在对于X线中肺结节的自动识别中敏感性和特异性分别达到了86.2%和85.0%,而对肺癌的自动识别中则达到了75.0%和83.3%,阳性预测值3.8%,阴性预测值99.8%,该结果具备比放射科医师更高的准确率。同样,在对肺部炎症的CT判读中AI也表现出类似的优越性[11],Wang等[12]建立CNNs算法模型学习了武汉市1 647例新冠肺炎感染患者和800例非感染患者的胸部CT,随后通过全国多临床机构疑似感染患者的胸部CT进行诊断测试后,模型的敏感性和特异性分别达到了92.3%和85.1%,中位数耗时0.55 min,相较人工判读时间平均减少15 min,为疫情抗击时的快速诊断提供了巨大帮助。关于AI诊断肺部影像资料的准确率,也有研究专门就算法模型和影像科医师判读水平进行对比后发现,目前AI技术已经能完全胜任胸部影像资料的判读并已达到影像科医师水平,有效加快了影像科判读工作流程,节省医疗资源[13]。同样,在骨骼疾病的诊断中,常规的骨骼判读较为容易,但在短骨、扁骨、骨盆、脊柱等不规则骨的诊断中仍存在不足。例如足部诸跗骨骨折由于解剖复杂、骨折线隐匿等特点,一直是骨科领域中难以诊断、易发生漏诊的问题,对此有CNNs算法专门就患者足部的X线进行学习后,实现了对舟骨骨折识别的76%敏感性、92%特异性,AUC达到0.84,限于数据库的规模,算法识别水平虽暂不能达到骨科专家效果,但已优于临床一线医师水平[14]。在对于桡骨远端骨折的识别中,基于更大数据库(2 340例患者)的CNNs算法最终AUC达到0.96,显示出与骨科专家相似的判读性能[15]。在对肋骨的隐匿性骨折识别中,有了CNNs算法的辅助,骨科专家的识别准确度由80.3%提高到91.1%,敏感度由62.4%提高到86.3%,并且平均诊断时间缩短73.9 s[16]。在肱骨髁上骨折、踝关节骨折及骨盆骨折的识别中,AI技术也达到了满意的临床水平,这无异于对患者精确诊断提供巨大帮助,弥补了临床上隐匿性骨折难识别、易漏诊等问题[17, 18, 19]。在脊柱侧弯的识别中,同样有研究以AI算法实现了对患者脊柱影像数据的快速识别,最终对脊柱侧弯诊断及程度分型的灵敏度和特异性分别达到了86.5%和96.9%,并且对Cobb角的识别精度可达6 °以下,当Cobb角超过30 °时能够达到100%识别[20]。类似地,基于AI算法分析CT、MRI影像资料,关节炎、骨质疏松、运动系统损伤以及骨龄的诊断效能都得到有效提升,不但提高了诊断效率和准确率,同时也大大降低了影像科医师的工作负荷[20, 21, 22, 23]。
在病理科,病理组织切片是最常用的检查方法。同样,各个临床科室的大量病理组织切片统一汇集至病理科后,读片工作给病理科医师带来了巨大工作负荷,尤其对于恶性非典型表现病理组织更是需要高年资医师消耗大量时间和精力完成判读。组织的病理学诊断是决定临床治疗决策的关键,一旦出现漏诊、误诊将延误最佳治疗时机,给患者带来巨大灾难。随着AI和数字化玻片成像技术的普及,病理科的诊断工作更加便捷,AI技术辅助病理读片也获得了发展机会,目前已在切片的肿瘤区域识别、转移检测、病理图像分割等方面显示出卓越成效[24]。在胃部肿瘤的病理诊断中,Kosaraju等[25]提出的基于多任务的DL算法模型——Deep-Hipo,能够对切片图像多尺度斑块同时采集并进行病理学分析,在对胃部组织切片的判读中能够准确识别正常胃黏膜和高分化、中分化、低分化腺癌以及印戒细胞症,该功能在结肠腺癌病理切片的识别中获得同样效果。对肺部肿瘤的病理识别,Kanavati等[26]基于EfficientNet-B3架构训练了CNNs模型,能够准确识别出肺部组织切片中的良恶性病变。还有学者通过建立DL模型以识别基底细胞癌病理图像,不但实现了较高的敏感性(97%)和特异性(94%),并成功将算法植入智能手机,病理科医师仅需要使用智能手机对显微镜目镜拍照上传,经(4.1±1.4)s后即可获得准确的病理诊断结果[27]。AI技术的辅助能够为病理科的读片、诊断工作提供便捷,使得病理结果产出更加高效、准确,同时有效减轻了病理科医师的工作负荷,同时也是迈向精准病理诊断的新一步[28]。
在超声科与内镜室,AI技术同样为超声和内镜的疾病诊断带来了高效辅助。基于DL的空间域和傅里叶变换频率域两个领域提取超声图像信息特征所建立的算法模型,其效能在区分甲状腺结节的良恶性方面超过了其他任何方法,改善了传统诊断方法中因过度依靠超声科医师个人经验而常出现的误诊情况[29]。也有研究使用AI算法学习超声心动图,可以智能捕捉心尖四腔观、双腔观及胸骨旁长轴环并估算出左心室射血分数,其准确性达到了超声科专家水平,能够为低年资超声科医师提供有效指导[30]。
在内镜检查中,胶囊内镜的出现将人类对胃肠道疾病的认知提升到了新的高度。然而,患者平均长达10 h的胶囊内镜视频的判读工作给内镜室及消化内科医师带来了沉重的压力,用时(96.60±22.53)min才能完成1例患者的结果判读,精力消耗极大。对此,Ding等[31]通过来自国内77家医疗中心6 970例患者的1.13亿张胃肠道胶囊内镜图像建立了CNNs算法模型,基于庞大数据库的训练,该模型对于胃肠道中正常组织和异常组织的识别敏感性达到99.9%。并且在识别出异常组织后,其对于炎症、溃疡、息肉、淋巴管扩张、出血、血管疾病、突出病灶、淋巴滤泡增生、憩室、寄生虫等异常病灶的分类敏感性也达到了76.8%,超过了内镜、消化内科专家平均水平,耗时仅为(5.90±2.23)min,显著降低了人力资源的消耗,极大推动了胃肠道疾病胶囊内镜的诊断工作。AI技术的辅助为超声科和内镜室的诊断工作带来了巨大的发展,依托AI技术,过去耗时耗力的诊断工作更加快速、准确,为患者的健康提供保障。然而同样需要注意的是,由于目前AI算法水平尚未十分完善,仍有可能发生识别错误导致临床误诊、漏诊,因此AI技术辅助医学诊断的最后一步仍然需要医学专家的终审。
治疗方案的决策是保障患者治疗效果的关键,但在临床治疗中对于采取手术或保守治疗不同临床医师常持相异观点,临床治疗方案决策存在一定风险。AI技术在规划决策、大数据分析领域的发展能够全面分析患者情况,为临床方案决策提供科学参考,改善了上述情况。
基于ML的模拟运算功能,临床风险计算器应运而生,能够通过分析既往患者的治疗方案和临床转归情况以对新患者进行预测,并通过10倍交叉验证所得结果,模型预测水平和临床真实转归仅有3.4%的误差[32]。同样也有研究通过AI技术推出了最优分类树模型POTTER,该模型能够通过算法判断是否对患者采取手术,及术后30 d内感染、脓毒症、死亡等不良并发症发生概率[33]。POTTER模型推出后在临床工作中获得了良好效果,但由于数据库规模限制仍存在一定局限性。随后,又有研究进一步基于超过5万例患者的临床数据进行了算法构建,推出了程序:“我的手术风险”,通过患者术前临床数据对患者术后伤口愈合不良、脓毒症、静脉血栓、重症监护病房监护、机械通气、急性肾损伤、神经系统和心血管障碍以及术后24个月内死亡率等8种不良转归精确预测,并且AUC值达到了0.94,能为临床医师选择风险最小的方案[34]。类似地,Durand等[35]通过算法对1 053例脊柱畸形的患者进行了手术或保守治疗的预测,通过既往史、影像学结果、正位片及侧位片的解剖参数测量等分析,模型最终预测的精度达到86%,对临床脊柱畸形的治疗提供决策参考;同样,杨俭等[36]通过DeepSurv算法、多分类器融合模型等AI技术,实现了对原发性肝癌患者的治疗方案智能决策、预后预测,通过院内多学科会诊验证后证实算法准确度达到94.13%。AI技术能够在患者入院后通过病情状态全面分析并提出科学化决策建议,在早期可以为临床医师选择手术或保守治疗方案提供有力参考,经过利弊权衡,最终促成最优治疗方案,很大程度上避免了错误的治疗方案及临床恶性后果,保障了临床患者生命健康。对于已确定需手术治疗的患者,依托AI技术,手术的开展也得到了进一步促进。例如在椎弓根螺钉置入术中,通过ML进行图像分析后,能够自动、智能识别到多个椎弓根标志点,为术中精准定位及微创手术提供帮助[37]。Forestier等[38]通过算法分析患者脊柱侧弯情况后,成功实现了术中最佳节段选择、术中下一步操作预测,并且准确率高达到95%,使手术医师的术中操作更加安全、精准。然而依然需要注意的是,由于术中情况错综复杂,完全依赖于AI技术仍有可能发生操作失误导致手术失败,因此AI技术辅助治疗方案决策及外科手术的过程中仍需要外科专家全程参与、监督,避免发生医疗事故。
另外值得一提的是,谈及AI技术辅助外科手术的话题,外科手术机器人的概念首当其冲。研究调查表明,当代社会对现代外科手术机器人的临床效果表示认可,并认为这样的AI机器人可能会取代外科医师[39]。同样,也有部分学者把现代外科手术机器人纳入了AI技术的应用范围内,指出目前临床上外科手术机器人已广泛投入使用,能够智能化完成外科手术并且效果甚至超越外科医师水平[40, 41]。其实不然,虽然早在20世纪80年代时期,初代外科手术机器人PUMA-200成功在手术中取得了良好辅助疗效[42],经过几十年的快速发展,如今由麻省理工学院设计发明的达·芬奇手术机器人也已广泛应用在了诸多外科手术之中,通过手术路径规划、切割范围确定、实时导航等功能结合更精细、灵活的操作优势,为普外、泌尿外科等多个领域手术的安全性、精准性和高效性带来了突破发展[43, 44],包括由我国北京积水潭医院自主研发的天玑骨科手术机器人[45]、南方医科大学的Orthobot脊柱手术机器人[46]更是融入了肌骨压力智能反馈的保护机制,在相关手术的安全性方面进一步取得卓越成效。尽管上述手术机器人的应用确实对外科手术起到了巨大的增益作用,但是从目前阶段来看其工作原理还不具备任何AI算法的色彩,也没有实现完全的智能化。外科手术机器人在手术中发挥的作用仍完全依赖于操作者的控制,并且作用效能也很大程度上取决于操作者的水平高低,因此更倾向于是一种高级的机械手术刀,能通过灵活、精细的切割工具和便捷的控制面板来实现传统外科手术中的困难操作,提高了手术的灵活性和精准性。这一点,本综述认为值得向广大医疗工作者强调。现阶段多数人把外科手术机器人同AI的概念混淆,其原因可能由于市面上过度的功能宣传和过高的主观期望,同时作为新时代的尖端技术,相关概念尚不成熟也造成了理解误区。但是,基于计算机系统的外科手术机器人仍具有实现AI技术的潜在远景,并且其最终的发展形态一定是与AI技术的融合,也只有在这一阶段才能真正创造出自主、智能操作的手术机器人。
安全的术中麻醉、优质的护理和有效的康复治疗是患者围手术期的重要环节,也是降低患者术后并发症的关键所在,AI技术的卓越发展也为上述环节的临床工作带来了推动。麻醉实施的安全性和效果不可避免地依赖于麻醉医师的水平,因此麻醉医师的水平差异导致麻醉效果不尽相同。通过AI技术的辅助,这一问题同样得到有效改善,患者术中麻醉效果和安全系数水平相应提高,并主要体现在六个方面:(1)麻醉安全监测;(2)麻醉深度控制;(3)麻醉不良事件预测;(4)智能超声辅助;(5)智能疼痛管理;(6)麻醉手术室智能管理[47]。例如,经过训练后的ML算法已能够成功实现对于麻醉患者气道插管的管理评估、诊断、协助以及预测,这对麻醉期间气道安全的监测和预警有很大帮助[48]。同样,在患者的临床护理工作中AI技术也起到重要作用。基于AI技术的无线传感器能够通过收集监护仪器产生的临床数据进行分析,实时监测重症患者的同时还能够早期预警患者不良并发症和死亡可能,有效减少了临床危急值假阳性误报,加强患者生命健康保障,同时也减轻了临床护士的工作负荷[49]。并且,基于AI算法的精确给药系统已通过临床测试和效果验证,相信在不久的未来将会投入临床护理应用[50]。在院外患者的康复治疗中,AI技术也可以促进患者功能恢复,为康复治疗带来便利。例如AI可穿戴式设备,可以在院外实时收集患者的健康参数并通过算法分析、反馈,当发现危急情况时向临床医生预警,加强了患者院外康复的随访和监管[51]。通过弱视患者视觉功能、康复需求和生活评分等数据训练的DL算法也能够加强视力辅助设备的开发,弱视患者佩戴后可以通过自身数据特征产生个体化辅助效果,对其院外康复、生活带来帮助[52]。并且,融合AI和虚拟现实技术的智能康复训练设备能够根据患者的实时反应提出最优训练方案,这样的康复设备可以帮助临床医师和患者优化康复方案与康复管理,构建更舒适、安全、高效、远程的协同康复系统[53]。这样的AI技术辅助麻醉、护理和康复治疗的模式,能够提高临床监管效率,降低不良事件发生率,为患者提供安全、有效的保障。
传统的药理研究需要经过靶标确定、成分设计、体内外试验、临床试验等步骤,周期可长达10~20年,这对于临床药物研发十分不利。网络药理学方法的提出打破了药理学研究“单一药物-单一靶点-单一疾病”的传统模式,成为药理学研究系统化新方法。但随着药理学数据爆炸式增长,如何在规模庞大药理数据中提取、挖掘有效数据并建立关联已成为药理研究的最重要需求[54]。AI技术的发展弥补了这一不足,通过AI技术可以指导药理化学合成、辅助数据多维描述、增强药理化学理论以及靶向挖掘新化合物[55],最终能够通过靶标预测、药物成分筛选、鉴定以选择合适成分,并对药物成分进行效力计算、分析合成可行性,制定出不同药物成分间的最优配比方案,为药物的药理学研究和医药研发带来了巨大辅助[56]。并且,对于分子药物领域和材料药物领域,AI技术也能够通过对有限的数据进行“元学习”以实现深度挖掘、扩增有效信息量,提高药理研究的效率[57]。AI医药研发公司Insilico medicine最近发表了一项使用DL算法来进行小分子药物设计的研究,通过21 d的模型建立和药物设计周期成功研发出一款新型的盘状蛋白结构域受体抑制剂,其效果和药代动力学在小鼠体内得到有效验证,对临床纤维化疾病的预防及治疗有重要意义[58]。相较于传统药物漫长的药理学研究周期,AI技术辅助下的低研发成本、短研发周期、高药物性能模式脱颖而出,能够加速合成生物学发展,甚至推动新型分子的数据挖掘。
在2020年新型冠状病毒的药物和疫苗研发工作中,AI技术也发挥了重要作用。有研究通过DL算法反向检测蛋白序列后成功预测了新冠病毒的潜在靶点,并提出一种含有结构蛋白和非结构蛋白的“Sp/Nsp鸡尾酒疫苗”,对新冠疫苗的研发有促进作用[59]。类似地,使用DL算法分析来自不同国家的新冠病毒序列能够确立出病毒保守基因并建立多肽数据库,为新冠疫苗和药物的研发提供科学参考[60]。AI技术还能够对现有药物进行二次挖掘,预测潜在药效,实现药物的再利用。经过二次挖掘,博赛匹韦、氯喹、盐霉素等近80种上市药物被证实具有抵抗新冠病毒的潜在药效[61]。对于我国传统中医自主研发的新冠特效药“清肺排毒汤”,AI技术也作出了合理的科学分析,经过算法验证后证实了“清肺排毒汤”的配伍药物中具备多个新冠有效靶点,能通过多种分子信号通路有效抗击新冠病毒[62]。这样的AI技术辅助医药开发的新型模式能显著提高研发效率,降低研发成本,未来势必会成为医药研发行业的新领域。
随着算法算力、计算机硬件水平的提升和大数据时代的来临,AI技术已获得蓬勃发展并渗入医学领域之中改变了传统医疗的方式,在急诊预检、病情评估、医学诊断、治疗方案决策及外科手术、麻醉、护理、康复治疗、药理研究和医药开发等临床工作中起到了不可忽视的辅助作用,为临床工作带来巨大便利。然而,虽然AI技术为临床带来了诸多便利,但作为一项兴起的新技术还仍处于起步阶段,医学相关的算法模型仍不成熟,尚存在系统故障和算法错误的风险,这将造成上述临床评估、诊断、方案规划等工作的误判,最终误导临床医生决策错误酿成医疗事故,医学AI的安全性仍待进一步提高。因此临床医生在借助AI技术便利的同时仍需保持清醒客观的认识,不能形成完全依赖,AI辅助的最终环节仍需医学专家严格地加以人工审核判决。并且,由于目前国内关于AI辅助医疗工作的法律法规尚不健全,因此当出现算法错误而发生医疗纠纷时,也还无法进行合理的权责分配以保障患者及临床工作者的权益。未来,AI技术若要进一步与医学融合、实现全面推广,仍面临重大挑战。
所有作者均声明不存在利益冲突










