
慢性肾脏病是全球重大疾病负担,心血管病已成为慢性肾脏病最常见且最严重的危害之一,为患者的生活质量和生命安全带来巨大威胁,这凸显了心血管风险管理在慢性肾脏病患者中的重要性。人工智能技术的发展及其在心血管病领域的逐步应用将有望助力应对该挑战。本文旨在对基于机器学习的人工智能技术在慢性肾脏病心血管风险预测方面的研究进行系统回顾,阐述人工智能在该领域的研究进展并展望未来的发展方向。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
慢性肾脏病(CKD)影响全球10%以上的人口,是当今重大的疾病负担。CKD患者的心血管病发病率是普通人群的10倍[1]。改善全球肾脏病预后组织(KDIGO)指南指出CKD是心血管病的危险因素,增加了心血管病的发病风险[2],因此,有效地预测和管理CKD的心血管风险至关重要。然而,长期以来一直缺乏CKD患者心血管风险早期的预测和管理工具。随着人工智能技术的迅猛发展,近年来已有研究开始探索人工智能在CKD心血管风险预测中的潜在应用价值,为临床早期精准诊疗提供了新方向。本文旨在对人工智能技术在CKD心血管风险预测方面的研究进行系统回顾,阐述人工智能在该领域的研究进展并展望未来的发展方向。
在20世纪40年代,人们开始探索计算机能否模拟人类的智能,艾伦·图灵提出了著名的图灵测试用于评估机器是否具备智能[3]。1956年,“达特茅斯会议”标志着人工智能领域的正式诞生[4],约翰·麦卡锡提出人工智能“要让机器的行为看起来就像是人所表现出的智能行为一样”。“人工智能之父”艾伦·图灵则认为人工智能是“如果一台机器能够与人展开交流,而且会被人误以为它也是人,那么这台机器就具有智能”。目前人工智能尚无统一的定义,但可以总结为“人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学”。当前,人工智能技术已进入众多医疗领域,全面涵盖疾病的诊断、治疗和预防[5, 6]。人工智能研究有多个分支,包括专家系统、机器学习、进化计算、模糊逻辑、计算机视觉、自然语言处理、推荐系统等[7]。机器学习主要包括监督学习、非监督学习和深度学习,监督学习通过已标记的数据训练算法,学习输入和输出之间的映射关系,常见算法包括支持向量机、朴素贝叶斯等[8, 9, 10, 11]。非监督学习使用未标记的数据来发现数据中的模式和结构,包括聚类、降维和关联规则挖掘。深度学习算法通过对输入数据进行特征学习和多层次特征提取,能够捕捉数据集中的复杂依赖关系,在图像识别、语音识别和自然语言处理中实现更准确地分类、预测和决策,包括卷积神经网络(CNN)和深度神经网络(DNN)等[12, 13, 14]。机器学习模型以海量的临床大数据为基石,结合不断精进的算法技术,深度剖析大型且复杂的数据集,可实现医学数据与临床风险的智能化预测,成为助力临床精准化和个性化诊疗的新工具。
随着人工智能技术的产生和发展,基于人工智能的疾病预测工具成为医学领域的新武器。尽管机器学习在心血管病领域的研究已取得大量成果,但关于使用机器学习预测肾脏病心血管风险的研究较少。经典心血管风险预测模型(FRS)只适用于一般人群,未考虑到CKD患者独特的心血管风险因素,在CKD患者中的准确性受到限制[15]。Matsushita等[16]引入了肾脏疾病独有的指标如估算肾小球滤过率(eGFR)与尿白蛋白/肌酐比值,开发并验证的线性回归模型CKD Patch模型更准确地校准了个体的eGFR或尿白蛋白/肌酐比值的差异,从而显著提高了心血管风险预测的准确性,成为2024年KDIGO指南推荐CKD患者心血管风险的预测工具。然而该模型仍依赖于经典建模方法线性回归,肾脏病和心血管病之间复杂的非线性关系可能无法被完全捕捉。
在人工智能技术的革新浪潮中,研究者们开始探索人工智能方法构建CKD患者心血管风险预测模型[17]。一项系统综述在一定程度上总结了机器学习方法预测CKD患者心血管事件方面的研究,其中常用的算法包括随机森林、支持向量机、分类和回归树以及深度CNN[18]。这些机器学习方法不仅能够利用大规模的临床数据进行预测,还能够发现潜在的、以往未被注意到的相关因素,从而提高预测模型的准确性和可靠性。
在CKD患者心血管风险预测模型中,机器学习方法通过对患者的基本信息、生化指标、医学影像资料等数据进行预处理和特征选择,提取出最具代表性的特征,并基于这些特征构建预测模型。这些模型通常具有较高的预测准确性和可靠性,为心血管风险预测领域提供了重要贡献。You等[19]基于英国生物样本库的纵向人群队列数据,利用机器学习算法从广泛的候选变量中识别出10个显著的临床预测因子,这些因子包括年龄、性别、药物使用情况以及生化指标等;该研究建立的模型能够较为准确地预测个体在未来10年内发生心血管事件的风险,为临床医师提供了有力的辅助工具。机器学习构建人工智能模型可预测CKD患者心力衰竭风险。Zelnick等[20]通过对慢性肾功能不全的队列数据进行分析,使用机器学习开发的预测模型(包括临床变量和心脏生物标志物)在普通人群和CKD人群中识别发生心力衰竭的风险较既往发表的预测模型表现更好,C 指数为 0.71,有助于识别心血管高危个体。透析患者常存在钙磷代谢紊乱、贫血、营养不良等问题,很多研究也关注了透析患者特异性的心血管风险。Mezzatesta等[21]采用多种机器学习技术,经过精心训练和筛选,成功构建了一种高效的支持向量机分类器算法(SVM)预测终末期肾病患者特有的心血管风险。通过利用意大利和美国两个大规模数据集进行外部验证,结果显示该算法在透析患者中展现了极高的预测准确率,分别达到了95.25%和92.15%。该研究不仅展示了SVM在预测透析患者心血管风险方面的巨大潜力,同时也为临床医师和患者提供了一种灵敏、可靠的预测工具,有助于更好地管理和预防心血管病在透析患者中的发生。随着高通量测序技术的发展和组学数据的日益丰富,为精准医学领域的预测建模带来更多机会。de Gonzalo-Calvo等[22]和Mohebi等[23]的研究通过整合多组学数据与机器学习算法(如决策树学习),将基因组学和蛋白组学的数据纳入心血管风险预测模型中,不仅进一步提高了模型的预测准确度和灵敏度,还展示了生物标志物(如miRNA和其他蛋白质标志物)在心血管风险评估中的潜力,强调了其在医疗决策支持系统中的应用价值。通过利用机器学习方法,研究者能够更全面地了解疾病的发病机制和患者个体的风险特征,从而开发出更精准、更有效的预测模型,为心血管病的预防、诊断和治疗提供新的思路和方法,也为个体化医疗和精准治疗提供有力支持。
深度学习的应用在医疗领域展现出强大的潜力,特别是在处理和分析大量临床数据方面。深度学习算法对患者的临床数据进行自动特征提取和模型训练,实现了对结局指标风险的准确预测,深度学习的应用在CKD患者心血管风险评估领域正日益受到重视。Ren等[24]通过采用最小绝对收缩和选择算子(LASSO)回归进行变量选择,并结合深度学习算法成功开发了一种基于临床数据的生存模型(DeepSurv),实现了对糖尿病肾病患者心血管风险的准确预测。不仅证明了深度学习在自动特征提取和模型训练方面的优势,还为CKD患者心血管风险的预测提供了新的思路和方法。随着医疗数据量的不断增长和技术的进步,深度学习有望在CKD患者心血管风险评估领域发挥更加重要的作用,但这并不意味着深度学习是万能的解决方案。Oh等[25]利用支持向量机、随机森林、XGboost、逻辑回归以及深度学习算法中的多感知器神经网络等多种模型,对年轻CKD患者中心血管并发症的风险进行识别。结果显示,随机森林算法在性能上表现最优,受试者工作特征曲线下面积(AUC)=0.87,而深度学习算法的性能并未超越传统的随机森林算法。这一发现可能归因于随机森林模型通过集成多个决策树的特性,在减少过拟合和增强模型鲁棒性方面表现出色,尤其适用于处理包含噪声和异常值的数据集。而深度学习算法通常更适用于处理具有大量数据、顺序特征和非结构化特征的数据集。因此在选择适用于医疗领域的机器学习方法时,需要综合考虑问题的特性、数据的可用性、计算资源的限制、模型的可解释性以及过拟合风险。
随着人工智能技术的迅猛发展,医疗健康领域正迎来革命性变革。基于医学影像和大语言模型(LLM)的人工智能技术的应用已取得了突破性进展,并在实际应用中取得了显著效果,已在多项权威研究中得到验证。2018年,美国食品药品监督管理局(FDA)不仅批准了利用视网膜筛查图像识别糖尿病视网膜病变的Digital Diagnostics系统,还通过了预测低血糖发作的Guardian Connect系统的认证。这两款自主人工智能系统为疾病早期干预提供了有力支持,极大程度提高了医疗效率与准确性。美国FDA先后批准了多项旨在实现疾病早期治疗和预防的人工智能技术[26, 27],标志着人工智能技术在医疗领域逐步落地的新时代的到来。基于眼底图像的人工智能模型在预测心血管病危险因素方面也取得了显著进展。《中国心血管病预防指南》[28]推荐应用的PRC-US模型[29]基于中美心肺血管疾病流行病学合作研究队列开发,经来自我国11个地区的17 330人的外部验证,AUC值接近0.8,在准确度和区分度方面均表现良好,展现出基于眼底图像评估心血管病发病风险的实际应用价值,值得进一步研究、验证和推广。
LLM是深度学习的分支,能够处理各种自然语言任务,并在识别单词和短语中复杂的逻辑关系方面显示出高效性,成功地训练了大量的文本数据,在医学领域疾病进展预测和临床决策应用中具有潜在的价值[30]。大语言通过与其他模型(如图像处理模型)结合形成多模态模型[31],能够基于多样化的数据类型进行预测,类似于人类临床医师在实践中依赖多种信息源进行决策,从临床笔记、医学文献、电子健康记录等多种数据中提取包含医疗诊断、生命体征、处方和实验室结果的关键信息,辅助医师进行诊断和治疗决策,以处理更复杂的任务,为肾脏病患者心血管病筛查带来新的可能。例如,有研究团队凭借尖端的自然语言处理技术,成功研发了一款名为“NYUtron”的大型医疗语言模型[32, 33]。NYUtron在5个核心任务(30 d全因再入院预测、院内死亡预测、合并症指数预测、住院时间预测及保险不报销预测)中的AUC值达到78.7%~94.9%,相较于传统的结构模型,性能提升幅度高达5.4%~14.7%[32, 33]。这些成果揭示了医疗语言模型在实时诊断中与医师协作的巨大潜力。尽管肾脏疾病领域心血管风险预测模型的开发相对落后,但随着大语言模型和人工智能技术的进一步发展,可以期待未来在该领域看到更多基于深度学习和ALL的应用,这将为肾脏病患者心血管病的诊断、治疗和管理带来新的机会和挑战。
未来医疗大模型有望实现多模态人工智能与医疗实践全流程的深入链接,应用于医疗教育和临床培训,提高药物研发和药物反应监测等方面的能力。但在实际应用中,人工智能与医疗结合仍面临一些挑战,如准确度、透明度、可解释性和理论与实践之间的差距等问题,以及对数据隐私和安全问题的担忧。为面对这些挑战,首先,开发任何基于人工智能的预测模型,都应该遵循高标准,参考统一的报告准则,如透明报告的多变量预测模型研究(TRIPOD)声明,在人群中得到广泛的外部验证,从而提高结果的可重复性,从而提高模型的可信度[34, 35];其次,在开发和应用人工智能预测模型时,应更加注重伦理审查和隐私保护[36];最后,应推动开展更多涉及人工智能预测模型的随机对照试验和多中心真实世界研究,政策落实和技术发展并进,实施科学原则、渐进式部署的策略,负责任地将生成式人工智能集成到医疗保健,以人的安康而非技术新颖为中心,从而开发积极主动型医疗模式,推动人工智能在医疗行业的落地应用[37, 38, 39, 40]。
随着人工智能技术的飞速进步,其在医疗领域的应用正逐渐描绘出未来医疗的发展方向。人工智能在构建CKD心血管风险预测模型方面取得显著优势,不仅可精准预测风险,实现早期诊断,还能提供个性化治疗方案,提高医疗服务的精准度和智能化水平,但仍面临着许多挑战,不能盲从先进的算法,需要确保模型准确性、透明度和数据隐私安全,注重伦理审查和隐私保护,开展更多随机对照试验和多中心研究以验证模型效果。未来人工智能有望在医疗领域发挥更大潜力,助力精准医疗,开启智能医学的新时代。
祝贺, 刘芳, 周禹, 等. 人工智能构建慢性肾脏病心血管风险预测模型研究进展[J]. 中华医学杂志, 2024, 104(28): 2668-2671. DOI: 10.3760/cma.j.cn112137-20240301-00464.
所有作者声明不存在利益冲突





















