
机器学习构建预测模型可以早期预测重症患者急性肾损伤(AKI),有助于临床尽早采取预防措施以降低AKI的发生率。机器学习也可以做到实时鉴定AKI亚型,以便于未来临床针对其亚型实施精准治疗,从而有可能改善患者预后。本文就机器学习构建AKI预测模型、机器学习鉴定重症患者AKI亚型与精准治疗以及机器学习应用于重症患者AKI领域的局限性与发展方向等方面进行论述,以供临床参考。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
急性肾损伤(acute kidney injury,AKI)是多种病因导致的临床疾病综合征,在重症监护病房(intensive care unit,ICU)中更为常见,表现为短时间内血肌酐升高和(或)尿量减少[1, 2]。目前,AKI常用的改善全球肾脏病预后组织(kidney disease improving global outcomes,KDIGO)诊断标准仅包括血肌酐和(或)尿量两个指标[3],而影响AKI发生、演变、治疗效果和结局异质性的因素,并未包括在目前的AKI-KDIGO诊断标准中,只使用血肌酐和(或)尿量来判断AKI,存在重要的局限性[4, 5]。此外,AKI发病机制复杂,病程长短各异,且临床缺乏特异性治疗手段。作为人工智能的重要组成部分,机器学习(machine learning,ML)可以从ICU大量生命体征、化验结果等信息中进行数据挖掘、预测疾病发生和筛选高危人群[3, 4, 5, 6, 7, 8],从而起到早期预测AKI的作用;ML还可将AKI分成不同的亚型,并有望针对其亚型实施精准的特异性治疗。
由于AKI在ICU具有较高的发病率和病死率,ICU医生一直希望未来应用于ICU中的预测模型能更早发现AKI患者,并及时警示医生,以便尽早干预并改善预后。构建传统预测模型的常用变量包括人口统计学资料、实验室指标、器官功能指标、生物标记物等,变量的选择完全由研究人员决定,尚缺乏统一的标准变量选择方案。传统预测模型大多由多因素逻辑回归分析方法构建,统计学表现参差不齐,且缺乏强有力的外部验证和临床评价。此外,传统预测模型没有考虑变量间的多重共线性,故不适用于自变量间存在联系的情况[9, 10, 11, 12]。
ML最初被用来处理高维数据,常需要面对冗杂的特征。ML常在模型训练开始前先一步对特征进行处理,方法有主成分分析、特征递归消除、整体重要性得分等,另外还可选出更重要或者与预测结局更相关的特征集合,这样不仅能解决特征间多重共线性问题,还能降低模型的复杂度,增加模型的可解释性,减轻模型训练负担,优化模型性能,提升预测能力[13, 14]。
有研究比较了ML与临床医生对AKI的预测能力,252例患者在进入ICU时、ICU第1天早晨、进入ICU 24 h三个时间点,分别由24名高年资医生、19名低年资医生以及ML算法对AKI-23级(AKI 2级和3级患者)发生风险进行了预测,结果发现,临床医生高估了患者的AKI发生风险且作出预测所需时间更长;而ML的表现与经验丰富的临床医生不相上下[15]。
由于临床医生在工作中需要同时治疗多例患者,很有可能被电子预警系统所干扰,预测水平可能有所下降。最近,Rank等[16]对心胸外科术后7 d内患者每15分钟进行一次AKI风险预测,通过收集患者人口学资料、生命体征、手术情况、液体出入量、肾毒性药物使用等共96种特征和数据,将预测模型分为训练集和测试集,采用深度学习中的循环神经网络(recurrent neural network,RNN)算法建立预测模型。令人振奋的是,RNN模型预测ICU患者AKI发生的准确性远大于临床医生,RNN模型预测AKI的受试者工作特征(receiver operating characteristic,ROC)曲线下面积(area under curve,AUC)高达0.90,而经验丰富的临床医生仅为0.75。同时,该模型在内部测试集中表现良好。
大多数ML采用入ICU第1天的数据和基线特征预测高危患者随后几天内发生AKI的风险,这样的预测模型存在重要的局限性,因为部分患者诱发AKI的主要原因,如新发的出血、感染、手术等[17],常发生在患者入ICU第1天之后。所以实时AKI预测模型将更为精准,推广性更强。
有学者利用每小时尿量实时预测ICU患者AKI-23级的发生风险,结果发现,60%的ICU患者一过性尿量下降与AKI的发生无关,但连续6~12 h尿量<0.5 ml/(kg·h)与重症患者高透析率、高病死率相关[18, 19]。研究者们通过分析重症患者AKI-23级发生前12小时尿量的变化趋势开发了一种深度神经网络模型,从第6小时起每小时输出该患者AKI的发生概率。该研究共纳入了35 573例ICU患者,预测AKI-23级发生的AUC值达到了0.89,优于逻辑回归模型(AUC:0.85)。研究者又将该预测模型应用于电子AKI报警系统(electronic Acute Kidney Injury alert systems,eAKI),发现系统可很好地预测严重肾功能下降,且提高了患者生存率,降低了这些患者需要肾脏替代治疗的比例。
ML有多种算法,包括逻辑回归、决策树、随机森林、朴素贝叶斯、XGBoost(eXtreme gradient boosting)、支持向量机(support vector machine,SVM)、卷积神经网络(convolutional neural networks,CNN)等,不同算法预测高危患者发生AKI的准确性存在一定的差异。ML性能由算法自身特点、数据类型、应用场景等多种因素共同决定:(1)逻辑回归适用于小数据集、二分类问题,数据集较大时运行速度慢,易欠拟合;(2)决策树结构较为简单,会对每个变量特征进行选择,预测准确性优于逻辑回归,但可应用性差;(3)随机森林由多个决策树组成,它可随机选取变量特征以降低特征间的多重共线性[20]。另外,随机森林对缺失值包容性强,能够处理多特征分类判别问题,训练出来的模型泛化能力强,可在其他人群中推广;(4)XGBoost与随机森林同属集成算法,XGBoost同样支持列抽样,并可减少模型计算量,是一种高效、精确的ML算法[21, 22];(5)SVM根本目标是在高维空间中创造一个最佳分类平面,将空间中不同数据分割开。已有研究表明,SVM对ICU中AKI人群死亡风险的预测与AKI流行病学调查结果相近,具有很高的预测价值[23];(6)CNN与RNN均是目前医学应用较多的算法[24, 25]。在ICU患者AKI预测方面,RNN更适用于时间序列数据,更容易发现患者变量特征在时间顺序上的重要变化。需要注意的是,不是所有指标都对AKI有预测价值,所以RNN又进行了许多优化,比如长短期记忆网络(long short-term memory,LSTM)、门控循环单元(gate recurrent unit,GRU)等。LSTM更能从繁杂变量特征中寻找出与预测AKI相关的重点特征,解决了RNN梯度提升与梯度爆炸问题。与LSTM相比,GRU可以保证预测的准确性,同时训练速度更快。RNN既能处理大量数据,又考虑了时间因素,更适于实时预测AKI。无论如何,ML在ICU患者中预测AKI的表现优于传统临床预测模型,并具有较高的敏感性和特异性[26]。
由于AKI存在较大的异质性,因此,确定AKI亚型对于识别不同的亚组重症患者对治疗的不同反应和改善预后至关重要。
脓毒性AKI约占重症AKI病例的50%[27]。考虑到危重患者及其基础疾病的异质性,脓毒性AKI可能存在不同的亚型。潜在结构分析(latent structure analysis)作为可将外在的、可见的变量通过潜在的、内隐的变量进行间接表述的一种方法,在探索变量间的潜在联系方面起到了重要作用,根据两变量的变量类型,可以分为潜在类别分析(latent class analysis,LCA)、潜在剖面分析、潜在特质分析和因素分析,其中LCA适用于潜在变量与外显变量均为分类变量的情况。在对301例脓毒性AKI患者进行的一项前瞻性研究中,收集了患者在进入ICU时的特征,包括性别、年龄、序贯性器官衰竭评分、AKI发生时间、实验室指标等,通过使用无监督ML中LCA算法构建LCA模型,将外在的AKI分型通过潜在的AKI亚型将患者重新划分为亚型-1、亚型-2。亚型-2患者中反映血管内皮通透性的肝素结合蛋白以及炎性标记物水平的中性粒细胞弹性蛋白酶-2、蛋白酶-3等较亚型-1患者显著升高[28, 29, 30, 31],并且亚型-2患者90 d病死率更高、第5天肾功能恢复情况更差[22]。由此可见,脓毒性AKI亚型患者的临床结局有所不同[32]。
Bhatraju等[33]同样通过构建LCA模型,将ICU中AKI患者分为AKI亚型-1与AKI亚型-2两组,对29个变量进行分析后发现两组存在明显差异:与亚型-1相比,亚型-2患者肾功能下降更明显,升压药的使用、脓毒症、急性呼吸窘迫综合征发生率更高,血管内皮功能活化标记物(血管生成素1、2)与炎症标记物(可溶性肿瘤坏死因子受体1)浓度较高,临床结局更差。LASSO回归是通过L1正则化的方法,将同时完成变量选择与建模,保留重要变量,可以降低模型的复杂度,增强模型的可解释性。该研究使用LASSO回归筛选变量后建立了上述3个生物标记物的“三变量模型”,此模型鉴定同一组ICU患者AKI亚型的准确度很高(c-统计量≥0.93)。而且两模型分辨的、不同AKI亚型的死亡和肾脏预后风险相似。将校正后的三变量模型应用于脓毒性休克患者使用不同血管活性药物治疗方案的人群中,并将其分为AKI亚型-1与AKI亚型-2后发现,在亚型-1中,尽早联合使用血管加压素与去甲基肾上腺素比单独使用去甲基肾上腺素患者的90 d病死率低(27%比46%),在亚型-2人群中则没有差别;此外,90 d病死率与不同AKI亚型相关[33]。因此,不同亚型AKI人群发生AKI的病理生理机制有所不同,对血管活性药物的治疗反应以及临床预后也可能存在差异[34]。
既往AKI亚型的变量选择大多使用结构化数据,这可能导致偏倚。随着ML算法的进步,采用记忆网络(memory networks,MN)算法,将美国重症医学医学信息集市(medical information mart for intensive care,MIMIC-Ⅲ)数据库ICU中AKI患者的结构化和非结构化数据(诊断描述、出院记录、放射学报告、超声报告等)均纳入到算法模型中,再使用K均值将患者分为三个亚型,其结果与主成分分析、自动编码器聚类结果相比较后发现,K均值算法聚类表现更好;亚型-1、亚型-2、亚型-3分别对应轻度、重度、中度肾功能下降,且分别易进展为AKI的Ⅰ级、Ⅲ级、Ⅱ级,表明AKI亚型能更准确地反映肾功能进展情况[21,35]。
总体来看,通过ML无监督学习算法可鉴定ICU患者AKI亚型,但ICU中AKI病因复杂,不能仅以2~3个亚型划分全部人群;另外,ML鉴定AKI亚型的模型构建中纳入的特征数据越多,鉴定效果越精确,可更好地预测哪些可能从某些治疗中获益的亚型患者,从而有利于临床针对AKI亚型实施更加精准的特异性治疗[32, 33, 34, 35, 36]。遗憾的是,迄今仍无基于AKI亚型实施精准治疗并评价其疗效的前瞻性对照研究发表。
首先,ICU相关数据库多种多样,数据处理标准各不相同,直接影响了模型的鲁棒性和泛化能力。其次,数据缺失和数据伪造等问题可能导致数据偏倚。再者,大多数研究设计为单中心、回顾性研究,样本量偏少,在内部验证集上表现良好,但经过外部验证评估的研究较少,推广性较差[37]。
未来的研究应注重以下几个方面的问题:(1)提高数据完整性,精确、真实的特征数据是建立稳定模型的基础;(2)针对不同病因和危险因素构建AKI亚型预测模型,提高预测准确度;(3)整合多模态数据,将肾活检病理、肾脏影像学等非结构化数据纳入模型可以提高模型的可靠程度[38];(4)制定统一的数据标准化处理规范与模型评价标准[39, 40],如外部验证标准、模型比较标准、可解释性标准、统计分析标准等,从而减少各研究中心模型的差异,有利于建立可靠性强和可推广的预测模型。
综上,随着数据量爆炸式增长和ML算法的优化,ML在预测ICU患者AKI领域有着良好的发展前景。将更准确、推广性更强的实时预测模型应用于电子AKI报警系统并与临床决策系统相结合,才可能真正降低AKI的发病率,节省医疗资源;ML在ICU中AKI亚型鉴定方面已初有成效,但针对不同亚型AKI采取哪些“精准”治疗,以及精准治疗能否改善患者预后仍需进一步的研究;目前还没有基于强化学习决策AKI治疗并与传统治疗相比较的临床研究,这也是未来的重要发展方向。
所有作者均声明不存在利益冲突





















