
乳腺癌的发病率在女性恶性肿瘤中位居第一位,乳腺磁共振成像(magnetic resonance imaging, MRI)因其多参数、多序列、多方位及敏感度高、无辐射等优点被运用于乳腺癌的早期诊断、术前指导手术方案的制订和疗效的评估。影像组学是近年来研究的热点,通过将数字医学图像转换为可挖掘的数据,高通量地从形态学、功能学影像图像中提取众多隐藏的定量信息,以反映组织潜在的病理及生理学特征,辅助精准医疗。目前影像组学在乳腺方面的研究基本囊括了乳腺疾病的整个诊疗过程。然而,影像组学向临床实践转化的过程中仍存在许多问题有待解决。本综述将对影像组学与人工智能的关系进行简要阐述,并根据已发表的文献总结多参数MRI影像组学在鉴别乳腺良恶性病变、预测乳腺癌分子亚型、淋巴结状态、新辅助化疗疗效、预后和无病生存期等方面的研究进展,讨论当前研究存在的局限性和挑战,以期为下一步研究的改进提供参考。
本刊刊出的所有论文不代表本刊编委会的观点,除非特别声明
根据2020年全球癌症统计数据显示,乳腺癌的发病率是女性恶性肿瘤的第一位,同时也是女性癌症死亡的主要原因[1]。随着人们对乳腺癌关注度的提高,乳腺癌的五年生存率在逐步提高[2]。积极预防、早期诊断、及时个体化治疗可以有效提高乳腺癌患者的生存率。乳腺磁共振成像(magnetic resonance imaging, MRI)作为乳腺X线摄影和超声检查的一种重要补充,因其多参数、多序列、多方位及敏感度高、无辐射等优点在临床上被广泛应用于乳腺癌早期诊断、术前指导手术方案制订和疗效评估[3]。多参数乳腺MRI包括T1WI、T2WI、扩散加权成像(diffusion weighted imaging, DWI)以及动态对比增强(dynamic contrast-enhanced, DCE)扫描,其中DCE序列是乳腺MRI检查的基础,在乳腺病变的形态学和血流动力学特征方面具有重要的价值[4]。此外,为了提高乳腺癌诊断和疗效评估的准确率,许多定量成像方法被运用于乳腺MRI中,比如基于DCE的药代动力学(pharmacokinetics, PK)分析,基于DWI的表观扩散系数(apparent diffusion coefficient, ADC)、扩散张量成像、体素内不相干运动成像、扩散峰度成像(diffusion kurtosis imaging, DKI)及磁共振波谱等[5, 6]。
影像组学是近年来一种新的研究分析方法,其基于机器学习算法提取数字医学图像上标注的感兴趣区(region of interest, ROI)定量特征,通过分析大量的影像组学特征进行更深层次的数据挖掘以实现对肿瘤表型的详细量化,目前已应用于多种肿瘤的研究领域[7]。多参数MRI成像方法联合影像组学特征能为放射科医生提供更多详细的信息,有助于提高影像诊断、疗效评估和预后预测的能力。本综述将对影像组学与人工智能的关系进行简要阐述,并根据已发表的文献总结多参数MRI影像组学在鉴别乳腺良恶性病变、预测乳腺癌分子亚型、淋巴结状态、新辅助化疗疗效、预后和无病生存期等方面的研究进展,讨论当前研究存在的局限性和挑战,以及下一步研究的改进和展望。旨在让临床及放射科医生了解多参数MRI影像组学在乳腺癌诊疗中的基本研究情况,为今后辅助临床诊疗和科研思路提供更多有价值的信息。
在精准医疗时代,影像组学是一个新兴的研究领域,于2010年由美国学者GILLIES等[8]首次提出,经荷兰学者LAMBIN等[9]进一步完善并进行全面的描述。影像组学即通过将数字医学图像转换为可挖掘的数据,高通量地从形态学、功能学影像图像中提取众多隐藏的定量信息[10],以反映组织潜在的病理及生理学特征,这些特征可能源自于遗传或分子水平,可用于临床诊断和预后预测[11]。由于定量数据数量庞大,此时需要一种比传统统计分析方法更强大的分析工具——人工智能。人工智能在医学影像中特指系统能够正确地解释外部数据,从这些数据中学习并利用所学实现特定目标或完成特定任务的能力,具有灵活的适应性[12]。随着计算机技术的迅猛发展,人工智能已被广泛应用于医学图像及大数据处理,包括图像重建、图像处理(分割、去噪)、分析和模型预测,使得影像组学研究得到飞速发展[13, 14]。其中机器学习是实现人工智能的一种基本方式,医学上较为常用的学习方法包括监督学习、无监督学习、半监督学习,每种方法都可用于解决不同的任务,监督学习旨在使用标签来推断分类或归纳,而无监督学习是在未标记数据中查找模式,半监督学习则是通过少量标记的数据和大量未标记的数据进行分类或归纳[15]。经典的机器学习算法包括线性回归、logistic回归、决策树、随机森林、支持向量机(support vector machine, SVM)、朴素贝叶斯(naive bayesian, NB)等[16]。深度学习则是机器学习领域的一类方法,这类方法大多基于特定类型的人工神经网络,具有大量的层和节点,比如前馈神经网络、卷积神经网络、循环神经网络、生成对抗网络等[17]。综上所述,人工智能、机器学习、深度学习三者的关系可归纳为人工智能>机器学习>深度学习。而影像组学仅仅是标准机器学习流程在医学图像方面的一个应用,基本流程分为[18]:(1)高质量标准化医学影像数据获取;(2)ROI分割;(3)特征提取;(4)特征筛选及模型建立。
乳腺良恶性病变的精确诊断对于后续治疗的选择至关重要,良性病变通常进行随诊观察,而对于可能恶性的病变则需要进行活检或手术。DWI和DCE是影像组学分析最常用的成像序列,DAIMIEL等[19]采用多中心回顾性分析93例乳腺病变患者,评估DCE和DWI影像组学分析结合机器学习对乳腺癌诊断的改善作用,结果表明结合DCE和DWI提取的多参数影像组学特征建立的模型效能最佳,曲线下面积(area under the curve, AUC)为0.85。ZHANG等[20]分别从多模态MRI的T1WI、T2WI、DKI图、ADC图和DCE-PK参数图中提取影像组学特征,使用SVM分类器建立基于单个序列和序列组合模型,最终基于T2WI、DKI图和DCE-PK参数图影像组学特征的组合模型对乳腺良恶性病变的鉴别能力最高,AUC为0.921。乳腺非肿块样强化(non-mass enhancement, NME)病变是影像良恶性鉴别的难点,LI等[21]回顾性分析232例NME病变,基于临床结合常规MRI特征、影像组学特征和联合特征,采用logistic回归分类器建立三种判别模型,结果表明时间-信号强度曲线类型和影像组学特征的联合模型表现出良好的分辨力,敏感度为0.869,特异度提高到0.839。在临床工作中,乳腺小病变(<1 cm)由于缺乏形态学和血流动力学特征等细节,在视觉上很难鉴别良恶性,活检也存在困难。GIBBS等[22]分析149例BI-RADS 4或5级增强后体积小于0.52 cm3的乳腺病变,基于DCE序列生成量化初始增强、整体增强、流出、增强曲线下面积的参数图,经SVM分类器分析得到各模型AUC范围为0.75~0.81,所有模型均有较高的阴性预测值(89%)和阳性预测值(83%),从而减少了良性小病灶不必要的活检。这些研究均表明基于多参数MRI影像组学特征建立的模型较单一参数模型在鉴别乳腺良恶性病变方面具有更高的效能,特别是对于NME病变及乳腺小病变具有一定的参考价值。有望在将来通过增加样本量、联合外部验证提高预测模型的泛化能力和鲁棒性。
乳腺癌是一种高度异质性的肿瘤[23],在形态学、组织病理学和生物学行为上具有高度多样性,不同分子亚型的乳腺癌治疗方法及预后也不同,因此准确地鉴别其分子亚型有着重要的临床意义。基于2011年St.Gallen会议[24]采用病理免疫组织化学方法替代基因表达谱分型的具体定义,结合雌激素受体(estrogen receptor, ER)、孕激素受体(progestogen receptor, PR)、人类表皮生长因子受体2(human epidermal growth factor receptor 2, HER-2)、Ki-67的表达水平,将乳腺癌分为Luminal A型、Luminal B型、HER-2过表达型和三阴性型四种分子亚型。LEITHNER等[25]回顾性分析了91例乳腺癌患者的DCE、DWI及 ADC图,采用多层感知器前馈人工神经网络进行两组分子亚型间比较,在区分三阴性型与非三阴性型乳腺癌的模型效能良好,AUC为0.86。HUANG等[26]基于多参数MRI(包括DCE、T2WI和ADC图)结合机器学习方法提取影像组学特征,对临床诊断为T 2~4期的162例乳腺癌患者进行回顾性研究,得到鉴别三阴性型与非三阴性型乳腺癌的模型AUC为0.965,鉴别HER-2过表达型与非HER-2过表达型的模型AUC为0.840。SONG等[27]分析了102例乳腺癌患者的半定量血流动力学参数图的纹理特征判断HER-2的表达水平,得出早期信号增强比图、信号强度斜率图提取的特征具有较高的诊断效能,有可能作为区分HER-2阳性和HER-2阴性乳腺癌的影像生物标志物。FAN等[28]通过完全无监督的混合凸性分析方法对基于DCE-MRI的像素时间-序列曲线进行分解,结合肿瘤及周围实质影像组学特征预测分子亚型,从而提高模型预测效能。综上所述,基于多参数MRI影像组学特征所建立的模型对乳腺癌分子亚型二分类的预测效能较好,但对于多任务模型还有待更多的开发和验证。
准确评估腋窝淋巴结(axillary lymph node, ALN)状态在预测患者预后、指导早期手术方式、新辅助化疗的选择起着重要作用[29]。在早期乳腺癌中,通常进行腋窝前哨淋巴结(sentinel lymph nodes, SLN)活检以确定有无淋巴结转移。影像组学提供了一种无创预测淋巴结状态的方法。CHAI等[30]从T1WI、T2WI、DWI和DCE第2期四种序列中提取形态和纹理特征,结合PK参数图预测是否有ALN转移,结果表明DCE第2期图像和PK参数图影像组学特征联合模型具有最高的效能,AUC为0.91,并指出当四种序列的所有特征和PK特征相结合时,效能并没有进一步提高(DeLong检验,P=0.48)。LI等[31]在预测ALN阴性或阳性的基础上再深入研究,利用影像组学列线图预测ALN转移的数目(1~3个或大于等于4个),训练集和验证集的AUC分别为0.94和0.84。LIU等[32]在DCE序列上提取肿瘤组织和瘤周组织的纹理特征结合临床病理特征术前预测乳腺癌SLN转移,结果表明加入临床病理特征可以提高预测能力。ZHAN等[33]应用一种新的影像组学方法——瘤周纹理转变(intra-peritumoural textural transition, IPRIS),定量提取了一系列代表肿瘤内外差异的图像特征,通过结合IPRIS特征和肿瘤内部传统影像组学特征预测ALN状态,模型验证集AUC值从0.824增加到0.855。由于ALN在乳腺MRI的成像受到心脏搏动伪影、呼吸伪影的干扰以及显示视野的限制,对非肿大的转移性淋巴结的影像诊断并不理想。夏旭东等[34]通过提取DCE和T2WI序列的ALN纹理特征预测乳腺癌较小体积的转移性淋巴结,模型AUC在训练集和验证集均大于0.950。以上研究表明,多参数MRI影像组学在术前预测乳腺癌淋巴结状态方面取得了良好的效果,具有优化当前乳腺癌患者治疗策略的潜力。
乳腺癌新辅助化疗(neoadjuvant chemotherapy, NAC)是指对于未发现远处转移的乳腺癌患者,在计划中的手术治疗或手术加放疗的局部治疗前,以全身系统性化疗作为治疗乳腺癌的第一步[35]。对于早期患者,术前接受NAC减小肿瘤体积,从而采用保乳手术代替全乳切除术,改善患者的生活质量;对于晚期患者则是将不可手术的乳腺癌降级从而创造手术的机会[36]。对NAC疗效的评估可分为完全缓解、部分缓解、稳定和进展[37]。BRAMAN等[38]通过提取117例乳腺癌患者NAC前DCE-MRI瘤内和瘤周纹理特征,预测患者NAC后是否达到病理完全缓解(pathological complete response, pCR),模型验证集AUC为0.74,表明可以较好地预测NAC后pCR。LIU等[39]建立了一个多中心多参数MRI影像组学(radiomics of multiparametric MRI, RMM)模型,该研究纳入了四个不同中心的586例NAC患者的多参数MRI(包括T2WI、DWI及DCE序列)影像组学特征和临床病理信息,与单独的临床模型和影像组学模型相比,RMM模型提高了预测的准确性,表明临床病理信息与影像组学的结合可以实现更高的预测效能。然而对于选择DCE序列的哪期进行特征提取最优,目前还没有明确的统一标准。LI等[40]分别从增强后第1期和增强多期(包括增强前、增强后1、2、3期)提取影像组学特征,早期预测127例HER-2阳性浸润性乳腺癌患者NAC后pCR的价值,结果表明基于增强多期的线性SVM模型AUC(0.84)高于增强后第1期模型AUC(0.69),提示多期DCE-MRI成像可以提供更多肿瘤异质性信息。关于DCE序列期像的选择仍需要更多的研究验证。
Ki-67表达水平[41]、组织学分级[42]是判断乳腺癌预后和疗效的重要临床指标。MA等[43]运用多种机器学习算法研究了DCE-MRI影像组学特征与乳腺癌Ki-67表达水平的关系,结果显示采用NB分类器的模型性能最好,AUC为0.773。FAN等[44]提取167例浸润性导管癌患者增强前、中间以及最后一期的DCE和T2WI序列影像组学特征预测组织学分级,结果显示DCE和T2WI特征融合后,模型效能均得到提升,表明解剖和功能MRI图像可以产生互补的信息,通过矩阵变换对影像组学特征进行特征融合可以优化它们之间的相关性。FAN等[45]运用多任务学习模型(multitask learning models, MTLs)同时预测Ki-67表达水平和组织学分级,通过提取DWI图及DCE减影图的影像组学特征提供互补信息的同时进行更好的预测,结果与单一任务的预测模型相比,使用MTLs联合预测Ki-67表达水平和组织学分级的性能均得到了改进。但由于Ki-67计数目前尚缺乏相关共识,Ki-67增殖指数的判定值在不同实验室中心可能不同[46],重复性欠佳,故相关的影像组学研究有待进一步在不同中心间进行验证。
乳腺癌无病生存期(disease free survival, DFS)是指从手术日期开始至疾病首次复发的时间、死亡日期、最后一次已知没有复发的日期或最近一次随访的日期[47]。疾病复发被定义为乳腺癌复发(局部或远处)或新的对侧原发乳腺癌(浸润性癌或导管原位癌)[47],该指标也常作为抗肿瘤药物Ⅲ期临床试验的主要终点。PARK等[48]基于术前多参数MRI(T2WI、pre-DCE、DCE和DCE减影图)影像组学标签评估294例浸润性乳腺癌患者的DFS,结果表明较高的影像组学评分(radiomics score, Rad-score)与较差的DFS显著相关,并建立联合影像组学标签、MRI常规影像特征和临床病理结果的影像组学列线图,改进了DFS的个体化评估。另外Oncotype DX是一种针对早期乳腺癌基因组的检测工具,可以量化新诊断的早期乳腺癌患者复发的可能性[49]。NAM等[50]运用DCE-MRI影像组学特征预测ER阳性浸润性乳腺癌Oncotype DX复发评分,得出较高的Rad-score、Ki-67表达水平及高p53与非低风险组相关,且Rad-score可区分低风险组和非低风险组,AUC为0.759。虽然乳腺癌的发病率较高,但随着医疗条件的改善及医疗水平的提高,其五年生存率逐步提高,复发率逐渐下降,影响DFS的因素较多,且基因检测价格昂贵,故此方面的多参数MRI影像组学研究目前仍较少。
多参数MRI影像组学从多种成像序列图像中高通量地提取潜在的定量数据表征肿瘤生物学特征,在乳腺病变良恶性、乳腺癌分子亚型、淋巴结转移、新辅助化疗疗效及乳腺癌预后和无病生存期等方面均有相关的研究应用,且结果较好,表明影像组学有望成为乳腺癌早期诊断、疗效评估和预后预测的影像生物标志物的可行性。但同时影像组学的临床应用也存在一些挑战:(1)目前大部分影像组学研究尚处于回顾性单中心研究的模式,样本量受到了限制,模型的泛化能力有待进一步提升;(2)图像分割包括自动、半自动和手动方法,自动和半自动分割适用于大数据,但分割算法仍有待评估[51],目前大部分影像组学研究采用手动分割方法,此方法耗时且具有一定的主观性,可能会影响结果的可重复性;(3)影像组学特征的可解释性未能得到充分验证,目前仍处于“黑匣子”状态,大部分研究并没有对有意义的影像组学特征进行具体的讨论。
虽然面临一些问题,但随着不同医院间的合作,多中心影像组学研究正陆续开展,模型得到了进一步外部验证,增加了研究结果的可靠性[39,52],且随着先进科学技术的发展,各种深度学习方法的应用有望打破不同中心间不同成像设备、不同扫描方案的壁垒,并与数字乳腺摄影、超声、正电子发射断层显像等联合进行多模态组学研究,为在精准医疗时代乳腺癌的早期诊断、疗效和预后评估提供无创性工具。
黄晓妮, 江远亮, 黄文才. 多参数MRI影像组学在乳腺癌诊疗中的研究进展[J]. 磁共振成像, 2023, 14(6): 151-155.
HUANG X N, JIANG Y L, HUANG W C. Research progress of multiparametric MRI radiomics in breast cancer[J]. Chin J Magn Reson Imaging, 2023, 14(6): 151-155.
National Natural Science Foundation of Hubei Province (No. 2019CFB285); Health Commission of Hubei Province Scientific Research Joint Project (No. WJ2019H113).
全体作者均声明无利益冲突。





















