
人工智能(AI)技术通过梳理和分析医疗数据进一步指导临床实践,已在医学领域取得了令人瞩目的进展。心力衰竭是各种心脏疾病的严重表现或晚期阶段,死亡率和再住院率显著升高。心电图(ECG)无创、便携、使用方便,是心血管疾病的重要检查手段。心力衰竭时心脏的病理生理变化会导致心电活动紊乱,因此,合理应用ECG数据可能为心力衰竭的早期诊断和治疗提供依据。本文阐述了基于AI-ECG分析在心力衰竭诊断、筛查和随访中的应用进展。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
心力衰竭(心衰)是多种原因导致心脏结构和/或功能的异常改变,使心室收缩和/或舒张功能发生障碍的一组复杂临床综合征[1]。发达国家的心衰患病率约为1.5%~2.0%,70岁以上人群患病率超过10%[2]。心电图(electrocardiogram,ECG)因其无创、便携、使用方便等优点已经成为心血管疾病的重要检查手段,心衰时心脏病理生理变化会导致心脏电活动改变,合理应用ECG数据可能为心衰的早期诊断和预后判断提供依据。人工智能(artifcial intelligence,AI)是一项新兴的应用计算机科学,主要包括机器学习和深度学习。机器学习可以自动化构建模型、分析数据,做出相应决策;深度学习包含多个处理层,能处理更复杂、抽象的数据[3, 4]。AI高效便捷的数据处理可以在临床决策中提供可靠的循证医学建议,本文重点阐述基于AI-ECG分析在心衰筛查、诊断和随访中的应用进展。
普通人群中无症状左心室功能不全(asymptomatic left ventricular dysfunction,ALVD)发病率为3%~6%,影响患者生活质量,可能增加死亡风险。早期发现早期治疗ALVD获益更大,因此开发廉价、无创的ALVD筛查工具尤为重要。Attia等人[5]使用梅奥诊所44 959例患者的12导联ECG和超声心动图数据构建了一个卷积神经网络(convolutional neural network,CNN)模型,识别左心室射血分数(left ventricular ejection fraction,LVEF)≤35%的患者。52 870例独立患者对模型进行验证,模型的受试者工作特征曲线下面积(area under the curve,AUC)、灵敏度、特异度和准确度分别为0.93、86.3%、85.7%和85.7%。在无ALVD的患者中,AI筛查为阳性患者未来发生心室功能障碍的风险是阴性患者的4.1倍,95%可信区间(confidence interval,CI)为3.3~5.0。在4 277例患者中进行外部验证时,AI-ECG检测ALVD的性能仍保持稳健,其AUC为0.82[6]。Jentzer等人[7]利用同一模型检测心脏重症监护室(intensive care unit,ICU)中LVEF≤40%的左心室收缩功能障碍(left ventricular systolic dysfunction,LVSD)患者,AI-ECG模型仍表现出良好预测效能:AUC为0.83,总体准确度为76%。心房颤动(房颤)可能会干扰超声心动图对患者LVEF的评估,且LVSD将直接影响房颤患者的治疗选择。为避免误导临床决策,Kashou等人[8]利用该模型来检测ICU中房颤患者LVSD,结果显示检测房颤和窦性心律患者LVSD的AUC分别为0.79和0.82。
然而,Attia等人[5]的研究无法识别轻症或处于左心室功能不全(left ventricular dysfunction,LVD)早期阶段的患者。Potter等人[9, 10]使用舒张期超声心动图参数和整体纵向应变重新定义LVD,使该定义能够应用于早期筛查,随后开发了一种机器学习随机森林算法,采用经过信号处理的“能量波形”ECG(“energy waveform”electrocardiogram,ewECG)精确识别LVD。结果显示模型筛查LVD的灵敏度为88%,特异度为70%,优于临床风险评分、生物标志物和自动ECG分析算法。ewECG应用于心衰风险人群的筛查可使超声心动图的临床需求降低45%,可以显著降低高危人群的医疗负担、节省医疗资源。
为验证AI-ECG在临床心衰患者诊治中的应用,Yao等人[11, 12]获取了22 641例既往无心衰的成人(干预组11 573例,对照组11 068例)ECG,主要结局为LVEF≤50%的新发LVSD。研究者将该算法整合到电子健康记录中以自动筛查LVEF下降患者,鼓励临床医生对阳性患者进行超声心动图检查。结果显示,LVEF下降的诊断率从对照组的1.6%明显提高到干预组的2.1%[比值比(odds ratio,OR)1.32,95%CI1.08~1.61,P=0.007];在1 356例阳性患者中,LVEF下降的诊断率从对照组的14.5%明显提高到干预组的19.5%(OR 1.43,95%CI1.08~1.91,P=0.01)。两组患者超声心动图使用率相似(对照组18.2%比干预组19.2%,P=0.17)的情况下,对于筛查结果阳性的患者,干预组得到的超声心动图多于对照组(对照组38.1%比干预组49.6%,P<0.01)。
即使LVEF正常,近50%患者会因左心室舒张功能障碍(left ventricular diastolic dysfunction,LVDD)而发生心衰[13]。对于LVEF下降的心衰患者,左心室舒张功能的变化早于或与收缩功能障碍同时发生,LVDD在心衰管理中必须引起高度重视[14]。2018年,Sengupta等人[15]研究证实,信号处理ECG(signal-processed surface electrocardiography,spECG)可以预测LVDD,AUC为0.91(95%CI0.86~0.95),灵敏度和特异度分别为80%和84%。2020年,该团队在此基础上开发了新的机器学习模型,使用spECG、传统ECG及临床数据检测LVDD[16]。这项多中心的前瞻性研究纳入了来自北美的1 202名受试者,使用机器学习模型对测试集中超声心动图的左心室松弛速度(relaxation velocities,e′)进行定量预测。结果显示,模型预测的e′值可较为有效地鉴别心肌舒张异常及LVDD,内部测试集的AUC分别为0.83、0.76,外部测试集的AUC分别为0.84、0.80,且该模型在不同地区的不同队列中性能均表现良好。未来可将其他超声心动图参数引入模型以增强其检测效能,如左心室、左心房应变;也可以对随访数据进行分析,了解机器学习模型评估预后的价值。
心脏磁共振(cardiac magnetic resonance,CMR)检查是评价心室容积、质量及LVEF的金标准,可为心衰诊断提供有力依据。Khurshid等人[17]为改善左心室肥厚(left ventricular hypertrophy,LVH)检出率,使用32 239名英国患者的12导联ECG及CMR结果开发了一个CNN模型(左心室质量-人工智能,LVM-AI),结果显示,LVM-AI预测的LV质量与CMR所得的LV质量具有相关性;UK Biobank测试集中,模型预测的LVH与心衰事件风险比可达3.97(95%CI2.70~5.84)。因此,AI结合ECG与心脏结构成像数据将有助于心血管疾病的诊断及预后判断。
心率变异性(heart rate variability,HRV)指逐次心跳周期RR间期的变化,反映自主神经系统功能[18, 19],HRV和心衰的关系是心衰领域研究的热点问题之一。这类研究大多从公开ECG数据库获得数据,利用AI算法鉴别健康人群和心衰患者,构建的模型均表现出良好的性能[20, 21, 22]。2014年,Liu等人[23]将支持向量机(support vector machine,SVM)分类器和三种非标准HRV特征(SUM_TD、SUM_FD和SUM_IE)结合,从来构建充血性心衰(congestive heart failure,CHF)分类模型,结果显示准确度、灵敏度、特异度均达100%。2019年一项研究利用长短期记忆网络(long short-term memory,LSTM)深度学习法识别CHF患者,选取5个公开数据库的ECG数据进行训练和测试,根据疾病严重程度将现有数据分为两组进行分析,并选取3个不同RR间期(例数分别为500、1000和2000)进行相互比较[24]。分析结果显示,使用BIDMC-CHF、NSR和FD数据库时,不同RR间期识别CHF的准确度分别为99.22%、98.85%和98.92%;使用NSR-RR和CHF-RR数据库时,不同RR间期识别CHF的准确度分别为82.51%、86.68%和87.55%。尽管此类研究的模型性能较为理想,但研究重点是机器学习方法的改进;算法通常采用大量HRV参数,导致模型复杂度增加。此外,选取数据库的样本量相对较小,以上因素都限制了其在临床中的进一步应用。
近年来,利用AI-ECG分析检测心衰的手段引起广泛关注。2016年,Masetic等人[25]开发了自动化ECG心搏分类系统,采用机器学习对正常及CHF患者心搏进行分类。研究者提取了BIDMC-CHF和PTB诊断ECG数据库中的2 800份ECG数据,1 500份来源于CHF患者,1 300份来源于正常人群。该研究采用自回归Burg法进行特征提取,设计了5种不同的分类器,即C4.5决策树、K-最近邻、SVM、人工神经网络和随机森林分类器。结果显示,随机森林分类器可达到100%的分类精确度,ROC曲线和F值均为1。以上研究证明将机器学习分类器应用于心衰领域,可为临床工作提供有价值的信息。
深度学习是机器学习的一个子领域,尽管深度学习发展刚刚起步,但是已经在心血管病诊治方面显示出很大潜力。2018年,Acharya等人[26]开发了一个11层CNN识别正常和CHF患者的ECG信号,并使用四个不同的数据集测试其性能。其中B组展现出了最佳性能,准确度、特异度和灵敏度分别为98.97%、99.01%和98.87%。虽然结果尚未达到100%的准确度,但该研究首次利用CNN模型检测CHF患者的ECG信号,为深度学习在CHF患者ECG中的应用奠定了基础。2021年,Cho等人[27]获取了17 127位患者的39 371份12导联ECG,使用CNN模型检测LVEF<40%的射血分数降低的心力衰竭(heart failure with reduced ejection fraction,HFrEF)患者。在内部和外部验证队列,12导联ECG检测HFrEF的AUC分别为0.913(95%CI0.902~0.925)和0.961(95%CI0.951~0.971),单导联ECG检测HFrEF的AUC分别为0.874(95%CI0.859~0.890)和0.929(95%CI0.911~0.946)。该研究表明使用单导联可穿戴ECG设备可以很好地进行HFrEF筛查,从而预防疾病的不可逆进展和降低死亡风险。此外,该研究进一步提供了模型的可解释特征:侧壁和前壁导联对结果检测产生了较大影响,心率、QT间期、QRS持续时间和T轴与模型间存在高度相关性。
近日,Vaid等人[28]首次使用LVEF连续值评估左心室功能,结合复合右心室结局指标评估双心室功能障碍,验证队列的AUC均在0.73~0.94。Matthias等人[29]首次采用CNN模型检测欧洲心脏病学会(European Society of Cardiology,ESC)标准的射血分数保留的心力衰竭(heart failure with preserved ejection fraction,HFpEF)患者,AUC为0.80,灵敏度高达0.99。
深度学习包括特征学习,可以自动识别执行任务所需的特征和关系,故而与传统机器学习相比,深度学习可以表现出更好的性能。2019年,Kwon等人[30]利用深度学习开发了一项基于ECG诊断心衰的算法(DEHF),并与逻辑回归和随机森林算法进行比较。该研究纳入2家医院22 765名患者的55 163份ECG,使用ECG和人口统计学特征作为预测变量。主要终点为检测HFrEF(LVEF≤40%),内部和外部验证队列的AUC分别为0.843(95%CI0.840~0.845)和0.889(95%CI0.887~0.891),明显优于逻辑回归[0.800(95%CI0.797~0.803),0.847(95%CI 0.844~0.850)]和随机森林[0.807(95%CI 0.804~0.810),0.853(95%CI 0.850~0.855)];次要终点为检测射血分数轻度降低及射血分数降低的心衰(LVEF≤50%),内部和外部验证队列的AUC分别为0.821(95%CI0.819~0.823)和0.850(95%CI0.848~0.852),亦优于逻辑回归和随机森林。
2019年,新型冠状病毒肺炎(COVID-19)的大流行对全球卫生系统产生了巨大影响,各国开始致力于对筛查工具的研发。一些严重感染的COVID-19患者会并发心肌炎,继而诱发心衰甚至死亡,因此对这类患者进行快速诊断是非常必要的。近日,ELEFT[31]这一AI检测软件已获得美国食品药品监督管理局(Food and Drug Administration,FDA)紧急使用授权(Emergency Use Authorization,EUA)认证,该软件可以通过分析患者ECG检测LVEF≤40%的患者,从而辅助临床医生的进一步决策,比如是否有必要进行超声心动图检查。但是,这一软件只能检测出LVEF较低的心肌受累进展期患者,进行早期识别需要评估患者左心室舒张末压。目前已有研究者致力于通过机器学习算法识别左心室舒张末压升高的患者,且AUC可达0.89[32]。
AI-ECG数据可以用于心衰患者的血药浓度监测。2021年ESC心衰指南[2]指出,当其他治疗无效时,可使用地高辛控制心衰合并房颤患者的心室率,窦性心律的HFrEF患者也可考虑使用地高辛降低住院风险。但是,流行病学研究显示大约1%接受地高辛治疗的心衰患者会出现洋地黄中毒[33]。由于地高辛的血清学浓度(serum digoxin concentration,SDC)检测耗时,临床上地高辛中毒的误诊或延迟诊断很常见。Chang等人[34]开发了一个根据ECG表现检测地高辛中毒(SDC≥2 ng/mL)的深度学习模型,研究纳入了2011年11月至2019年2月地高辛中毒患者的61份ECG和急诊患者的177 066份ECG,结果显示模型识别地高辛毒性的AUC为0.912,灵敏度和特异度分别为84.6%和94.6%。该模型未来可以为急诊地高辛毒性检测提供决策支持;也可整合于救护车或偏远地区的ECG机器。
李歆慕, 刘彤. 人工智能心电图在心力衰竭中的应用进展[J]. 中华心力衰竭和心肌病杂志, 2023, 7(3): 185-189. DOI: 10.3760/cma.j.cn101460-20210818-00064.
所有作者均声明不存在利益冲突





















