
探讨动态对比增强MRI(dynamic contrast enhanced MRI, DCE-MRI)影像组学特征在预测乳腺癌腋窝淋巴结(axillary lymph node, ALN)转移中的价值。
回顾性分析2017年1月至2020年12月间经河南省人民医院手术病理证实为乳腺癌患者的首次术前MRI图像及临床病理资料(包括患者年龄、病灶的位置和大小、SBR分级,ER、PR、HER-2及Ki-67的表达情况,ALN是否转移及脉管癌栓的有无),共入组356例患者,年龄26~82(49.17±10.75)岁,并按8∶2的比例将其随机分为训练集(n=284)和测试集(n=72)。提取DCE-T1WI序列第3期图像的影像组学特征,并通过Mann-Whitney U检验、Z分数归一化、方差阈值、K最佳及最小绝对值收缩和选择算子(least absolute shrinkage and selection operator, LASSO)算法筛选与ALN转移强相关的定量影像组学特征;应用多种分类器算法以排列组合方式分别构建影像组学标签,并利用受试者工作特征(receiver operating characteristic, ROC)曲线得到的曲线下面积(area under the curve, AUC)、敏感度、特异度及准确度评价模型的预测性能,根据模型效能从中确定最佳影像组学预测模型。
356例乳腺癌患者中ALN转移组117例(32.9%,117/356),无ALN转移组239例(67.1%,239/356);HER-2阳性表达在ALN转移组和无转移组之间的差异有统计学意义(χ2=5.433,P=0.020),其余临床病理指标在两组间的差异均无统计学意义(P>0.05);且临床病理指标在训练集与测试集患者中的差异均无统计学意义(P>0.05)。从初始653个影像组学特征中共筛选得到18个与ALN转移强相关的影像组学特征,包括形态特征、一阶特征及纹理特征各6个。基于绝对值最大归一化和Bagging决策树算法构建的影像组学标签是预测ALN转移的最佳模型,该模型在训练集和测试集的AUC、敏感度、特异度和准确度分别为0.929 [95%置信区间(confidence interval, CI):0.897~0.960]、69.9%、96.9%、88.0%和0.803(95% CI: 0.701~0.905)、75.0%、75.0%、75.0%。
基于DCE-MRI影像组学特征构建的预测模型有助于乳腺癌术前ALN评估。
本刊刊出的所有论文不代表本刊编委会的观点,除非特别声明
乳腺癌是全球妇女癌症相关死亡的主要原因,其发病率在大多数国家中居于首位[1, 2]。术前评估乳腺癌患者的ALN状态对临床分期、治疗及预后至关重要[3, 4]。病理学检查是目前临床上评价ALN转移情况的金标准,但其为有创性检查,且由于肿瘤的异质性常常会导致病理结果的不确定性[5, 6]。动态对比增强MRI(dynamic contrast enhanced MRI, DCE-MRI)因软组织分辨率较高而在乳腺癌诊断及疗效评价方面应用广泛,但常受扫描范围限制很难显示整个腋窝,难以直接诊断ALN,且容易受到评价者主观因素影响,存在较高的假阴性率[7, 8, 9]。既往研究[10, 11]多通过常规影像学表现对ALN状态进行评估,然而转移性ALN与无转移ALN间的形态学特征并没有明确界限,该类方法的预测效能并不理想。影像组学是以定量成像技术为基础的新兴学科,可将医学影像图像转化为深度反映肿瘤异质性的空间数据,并利用这些数据探索肿瘤生物学信息间潜在的联系[12, 13, 14, 15]。超声便携无创,其影像组学模型对乳腺ALN的评估在既往研究中也获得了较为满意的效果,但是超声的软组织分辨力不如DCE-MRI[16]。因此本研究通过影像组学建模的方法回顾性分析356例乳腺患者的DCE-MRI组学特征,旨在探讨其术前预测乳腺癌ALN转移的价值,为无创性准确评估乳腺癌ALN状态提供新方法。
收集自2017年1月至2020年12月于河南省人民医院确诊为乳腺癌患者的临床病理及MRI图像资料进行回顾性分析。本研究遵守《赫尔辛基宣言》,经河南省人民医院伦理委员会批准(批准文号:2018022),免除受试者知情同意。纳入标准:(1)首次经手术病理证实为浸润性非特殊类型乳腺癌;(2)存在术前乳腺MRI基线检查(也即未接受任何治疗的首诊MRI检查),且均有术后腋窝淋巴结清扫(axillary lymph node dissection, ALND)或术中前哨淋巴结活检术(sentinel lymph node biopsy, SLNB)或术前ALN穿刺病理结果;(3)图像质量能满足图像分析要求。排除标准:(1)年龄<18岁,或孕期/哺乳期妇女;(2)MRI检查前已行活检、放疗、化疗等治疗的乳腺癌患者。本研究中ALN阳性结合ALND和穿刺活检的结果确定,ALN阴性主要经ALND和SLNB的结果来确定,对于SLNB阴性的患者我们直接认定其未发生ALN转移,并根据此标准将患者分为ALN转移组和无转移组。本研究共纳入356例患者(共356个病灶),年龄26~82(49.17±10.75)岁,包括ALN转移患者117例,无转移患者239例。
MRI检查采用GE Discovery 750 3.0 T MR扫描仪,患者俯卧于专用的乳腺相控阵表面线圈上,双乳自然下垂;检查前先用12 G静脉留置针建立静脉通道。增强扫描采用动态对比增强Vibrant 3D序列,TR 3.9 ms,TE 1.7 ms,层厚1.3 mm,扫描层数128;均扫描8期,每期扫描时间约1 min,第1期为不注射对比剂的蒙片扫描。第1期扫描结束后,用高压注射器快速注射对比剂(钆喷替酸葡甲胺,Gd-DTPA),剂量0.2 mmol/kg,速度2.0 mL/s,于10 s内快速推注,继而快速推注20 mL生理盐水冲管,之后再扫描7期,单个时相扫描层数为124层。
将自PACS(picture archiving and communication systems, PACS)系统导出的DICOM(digital imaging and communication in medicine, DICOM)格式的乳腺DCE-T1WI序列中的第3期图像导入ITK-SNAP软件(Version 3.8.0,http://www.itk-snap.org),并逐层对肿瘤感兴趣区(region of interest, ROI)进行手工勾画(图1)。病灶区的ROI先由一名从事乳腺影像诊断5年以上的放射科医师在不知病理结果的情况下进行勾画,再由至少10年工作经验的副主任医师进行ROI校对,如存在差异则由更高资历的乳腺放射科医生确定最终的ROI。


应用uAI临床研究平台(uAI Research Portal, United Imaging Intelligence, China)对DCE-MRI组学特征进行提取与筛选。首先,将入组的356例患者依据8∶2的比例随机分配为训练集(n=284)和测试集(n=72),并应用该平台对其DCE-MRI图像中勾画的ROI进行组学特征提取;其次,训练集中进行Mann-Whitney U检验初步筛选出643个影像组学特征,进一步应用Z分数归一化减少特征的量纲差异、方差阈值法去除低方差特征、K最佳(即F-value法,K设置为100)去除与ALN标签低相关特征后保留了100个特征;最后,使用最小绝对值收缩和选择算子(least absolute shrinkage and selection operator, LASSO)算法回归降维继续筛选与乳腺癌ALN转移强相关的组学特征。
应用绝对值最大归一化等8种预处理器(包括Box-Cox变换、L1范数正则化、L2范数正则化、最大最小归一化、Quantile变换、Yeo Johnson变换、Z分数归一化)对筛选出来的18个影像组学特征进行标准化处理。然后再应用Bagging决策树等13个分类器[包括AdaBoost、决策树、高斯过程、梯度下降树、K近邻、逻辑回归、偏最小二乘判别分析、二次判别分析、随机森林、随机梯度下降、支持向量机(support vector machine, SVM)、XGBOOST]进行训练,以上不同的预处理器和分类器算法步骤均采用分类组合方式进行,最终结合模型效能评价指标选择一种最佳算法模型。采用ROC曲线得到的AUC、敏感度、特异度及准确度分析影像组学模型的预测效能。影像组学分析流程图见图2。


通过我院的电子病历系统来收集患者的临床资料,包括患者的年龄、癌灶的位置、大小等,病理指标包括病理SBR(scarf bloom richardson)分级、雌激素受体(estrogen receptor, ER)、孕激素受体(progesterone-receptor, PR)、人表皮生长因子受体2(human epidermal growth factor receptor-2, HER-2)、Ki-67抗原的表达情况、ALN是否转移,以及是否合并脉管癌栓等。HER-2表达状态的确定采用免疫组织化学联合FISH(fluorescence in situ hybridization, FISH)检验[17],并依据中国抗癌协会乳腺癌诊治指南与规范(2021年版)及美国临床肿瘤学会指南[18, 19],将ER分为低表达(≤10%)组和高表达(>10%)组,PR以20%为界分为低表达(≤20%)和高表达(>20%),Ki-67分为低表达(<20%)和高表达(≥20%)。所有数据均记录于Excel表格中。
采用 SPSS 25.0软件包比较训练集和测试集、ALN转移组和无转移组的临床病理特征差异。符合正态分布的连续性变量以(±s)表示,组间比较采用独立样本t检验,非正态分布连续性变量资料以中位数(上、下四分位数)表示,两组间比较采用Mann-Whitney U检验;计数资料以百分数表示,组间比较采用2检验或Fisher确切概率检验,有序分类变量采用秩和检验。P<0.05为差异有统计学意义。
本研究共入组356例乳腺癌患者,均为女性,单发病灶,包括ALN转移患者117例(32.9%,117/356),无ALN转移患者239例(67.1%,239/356);分析训练集和测试集患者在临床病理指标方面的差异(表1),结果显示二者在患者年龄、病灶位置及大小、病理分级,HER-2、ER、PR及Ki-67表达,合并脉管癌栓及ALN转移等方面的差异均无统计学意义(P>0.05)。HER-2阳性表达在ALN转移组和无转移组患者中的差异有统计学意义(χ2=5.433,P=0.020),余临床病理指标在两组患者中的差异均无统计学意义(P>0.05)(表2)。

训练集与测试集中临床病理指标比较
Comparison of clinicopathological indicators between the training set and the test set
训练集与测试集中临床病理指标比较
Comparison of clinicopathological indicators between the training set and the test set
| 项目 | 训练集(n=284) | 测试集(n=72) | 统计值 | P值 |
|---|---|---|---|---|
| 年龄(±s)/岁 | 49.33±10.77 | 48.52±10.74 | 0.568① | 0.570 |
| 位置/例(%) | ||||
| 左乳 | 145(51.1) | 35(48.6) | 0.158② | 0.691 |
| 右乳 | 139(48.9) | 37(51.4) | ||
| 病灶大小/[M(Q1,Q3)]/mm | 22(16.0,30.8) | 22(16.0,30.0) | 0.368③ | 0.713 |
| 病理分级/例(%) | ||||
| SBR 1级 | 8(2.8) | 1(1.4) | 0.392③ | 0.695 |
| SBR 2级 | 199(70.1) | 54(75.0) | ||
| SBR 3级 | 77(27.1) | 17(23.6) | ||
| HER-2/例(%) | ||||
| 阴性 | 211(74.3) | 51(70.8) | 0.354② | 0.552 |
| 阳性 | 73(25.7) | 21(29.2) | ||
| ER/例(%) | ||||
| ≤10% | 84(29.6) | 23(31.9) | 0.153② | 0.696 |
| >10% | 200(70.4) | 49(68.1) | ||
| PR/例(%) | ||||
| ≤20% | 158(55.6) | 43(59.7) | 0.391② | 0.532 |
| >20% | 126(44.4) | 29(40.3) | ||
| Ki-67/例(%) | ||||
| <20% | 84(29.6) | 20(27.8) | 0.090② | 0.764 |
| ≥20% | 200(70.4) | 52(72.2) | ||
| 脉管癌栓/例(%) | ||||
| 无 | 202(71.1) | 46(63.9) | 1.424② | 0.233 |
| 有 | 82(28.9) | 26(36.1) | ||
| ALN/例(%) | ||||
| 阴性 | 191(67.3) | 48(66.7) | 0.009② | 0.925 |
| 阳性 | 93(32.7) | 24(33.3) | ||
注:①为t值;②为χ2值;③为Z值;M(Q1,Q3)表示中位数(上、下四分位数);SBR为乳腺癌病理学分级方法;HER-2为人表皮生长因子受体2;ER为雌激素受体;PR为孕激素受体;Ki-67为核增殖抗原;ALN为腋窝淋巴结。

ALN无转移与ALN转移组临床病理指标比较
Comparison of clinicopathological indicators between ALN without metastasis and ALN metastasis group
ALN无转移与ALN转移组临床病理指标比较
Comparison of clinicopathological indicators between ALN without metastasis and ALN metastasis group
| 项目 | 无转移组(n=239) | 转移组 (n=117) | 统计值 | P值 |
|---|---|---|---|---|
| 年龄(±s)/岁 | 49.41±10.86 | 48.68±10.55 | 0.598① | 0.550 |
| 位置/例(%) | ||||
| 左乳 | 120(50.2) | 61(52.1) | 0.117② | 0.733 |
| 右乳 | 119(49.8) | 56(47.9) | ||
| 病灶大小[M(Q1,Q3)]/mm | 22(16,31) | 22(16,29) | 0.258③ | 0.797 |
| 病理分级/例(%) | ||||
| SBR 1级 | 8(3.3) | 1(0.9) | 0.864③ | 0.387 |
| SBR 2级 | 170(71.1) | 83(70.9) | ||
| SBR 3级 | 61(25.5) | 33(28.2) | ||
| HER-2/例(%) | ||||
| 阴性 | 185(77.4) | 77(65.8) | 5.433② | 0.020 |
| 阳性 | 54(22.6) | 40(34.2) | ||
| ER/例(%) | ||||
| ≤10% | 75(31.4) | 32(27.4) | 0.607② | 0.436 |
| >10% | 164(68.6) | 85(72.6) | ||
| PR/例(%) | ||||
| ≤20% | 134(56.1) | 67(57.3) | 0.046② | 0.830 |
| >20% | 105(43.9) | 50(42.7) | ||
| Ki-67/例(%) | ||||
| <20% | 75(31.4) | 29(24.8) | 1.652② | 0.199 |
| ≥20% | 164(68.6) | 88(75.2) | ||
| 脉管癌栓/例(%) | ||||
| 无 | 165(69.0) | 83(70.9) | 0.135② | 0.714 |
| 有 | 74(31.0) | 34(29.1) | ||
注:①为t值;②为χ2值;③为Z值;M(Q1,Q3)表示中位数(上、下四分位数);ALN为腋窝淋巴结;SBR为乳腺癌病理学分级方法的名称;HER-2为人表皮生长因子受体2;ER为雌激素受体;PR为孕激素受体;Ki-67为核增殖抗原。
应用Z分数归一化、方差阈值和K最佳(即F-value法,K设置为100)及LASSO回归算法去除冗余特征,从初步筛选的643个影像组学特征中进一步得到与ALN转移相关性强的18个影像组学特征,包括形态特征、一阶特征及纹理特征各6个[20](图3)。


将筛选出的与ALN转移强相关的18个影像组学特征采用8种预处理器算法和13种分类器进行排列组合式模型训练得到基于绝对值最大归一化及Bagging决策树算法,结合模型的特征数、AUC值、敏感度、特异度等效能评价指标选择的最佳影像组学预测模型(图4)。本研究中最佳预测模型的AUC值、敏感度、特异度和准确度在训练集及测试集中分别为0.929(95% CI:0.897~0.960)、69.9%、96.9%、88.0%和0.803(95% CI:0.701~0.905)、75.0%、75.0%、75.0%(表3,图5)。



部分影像组学模型预测ALN转移与否的效能分析
Analysis in the efficiency of sectional radiomics models in predicting ALN metastasis
部分影像组学模型预测ALN转移与否的效能分析
Analysis in the efficiency of sectional radiomics models in predicting ALN metastasis
| 影像组学标签 | 敏感度/% | 特异度/% | 准确度/% | AUC值 | 95% CI | |
|---|---|---|---|---|---|---|
| 下限 | 上限 | |||||
| 绝对值最大归一化+Bagging决策树模型* | ||||||
| 训练集 | 69.9 | 96.9 | 88.0 | 0.929 | 0.897 | 0.960 |
| 测试集 | 75.0 | 75.0 | 75.0 | 0.803 | 0.701 | 0.905 |
| Yeo Johnson变换+决策树模型 | ||||||
| 训练集 | 53.8 | 94.8 | 81.3 | 0.798 | 0.744 | 0.852 |
| 测试集 | 58.3 | 77.1 | 70.8 | 0.784 | 0.677 | 0.890 |
| Quantile变换+决策树模型 | ||||||
| 训练集 | 53.8 | 94.8 | 81.3 | 0.798 | 0.744 | 0.852 |
| 测试集 | 54.2 | 81.2 | 72.2 | 0.775 | 0.666 | 0.884 |
| L1范数正则化+决策树模型 | ||||||
| 训练集 | 43.0 | 95.8 | 78.5 | 0.823 | 0.776 | 0.869 |
| 测试集 | 20.8 | 85.4 | 63.9 | 0.635 | 0.510 | 0.760 |
| L1范数正则化+Bagging决策树模型 | ||||||
| 训练集 | 73.1 | 94.8 | 87.7 | 0.946 | 0.919 | 0.972 |
| 测试集 | 58.3 | 70.8 | 66.7 | 0.735 | 0.622 | 0.849 |
注:*表示此模型为最佳模型。ALN为腋窝淋巴结;AUC为受试者工作特征曲线下面积;CI为置信区间;Bagging决策树为引导聚集决策树算法;Yeo Johnson变换是幂变换的方法之一;Quantile变换为分位数变换;L1范数正则化是在支持向量机学习过程中,一种对成本函数求解最优的方法。


ALN转移与否对乳腺癌患者临床意义重大,探索一种无创性方法术前评价ALN状态有助于提高乳腺癌患者术后生活质量[21]。本研究构建了基于DCE-MRI影像组学特征的不同预测模型,根据不同的预处理器和分类器算法共建立104个模型对乳腺癌ALN病理状态进行预测,最终发现基于绝对值最大归一化及Bagging决策树算法得到的预测效能最佳(训练集和验证集AUC分别为0.929和0.803),敏感度、特异度及准确度均较高。其中,提取得到的形态特征、一阶特征及纹理特征与ALN状态相关性紧密,有望成为辅助临床决策的影像学指标。
本研究中的临床病理特征(患者年龄、病灶位置及大小、病理分级,HER-2、ER、PR及Ki-67表达,合并脉管癌栓及ALN转移与否)在训练集与验证集两组间差异均无统计学意义(P>0.05)。表明临床病理指标并没有对构建的影像组学模型造成干扰。HER-2阳性表达在ALN转移组和无转移组间差异显著,余临床病理指标在两组患者中差异无统计学意义(P>0.05),这可能与HER-2阳性患者易发生ALN转移有关。有研究比较了HER-2阴性(IHC 0)与HER-2低表达(IHC1+、IHC2+/ISH-)肿瘤的临床病理特征,结果显示,相较于HER-2阴性的乳腺癌,“HER-2低表达”乳腺癌患者的年龄更大,癌灶体积也较大,淋巴结发生转移的可能性更高[22]。这可能是由于HER-2属于一种酪氨酸激酶,能够参与细胞信号转导,促进肿瘤细胞增殖。因此HER-2阳性者多预后不良,发生淋巴结转移的几率更大。
早期强化能够反映对比剂在血管内的分布,也是肿瘤微血管状态和异质性等生物学信息的体现[23],既往研究选择增强3期建立预测ALN转移的影像组学模型,取得了不错的效果[24, 25]。鉴于既往研究的经验及大部分病灶在DCE增强3期时获得了充分的强化,本研究选取DCE-MRI增强3期影像组学特征建立术前ALN预测模型,且研究结果显示该预测模型在训练集和测试集中的AUC值、敏感度、特异度和准确度分别为0.929、69.9%、96.9%、88.0%和0.803、75.0%、75.0%、75.0%。该模型预测效能略低于LIU等[26]基于DCE-MRI组学特征建立的术前ALN预测模型(准确度为85%,AUC值为0.83),这可能与其模型是基于时间-信号强度曲线选择的增强最明显时相图像建立有关,也可能与选择的建模方法不同有关。目前关于术前ALN转移预测模型的构建,很多学者就如何选择合适的增强时相做了不少的探索。有研究表明第2时相于给药60~90 s后获得,能够得到强相关的肿瘤与背景间对比[27, 28]。但关于最佳增强时相的选择目前并没有定论,故未来我们会深入开展对比分析基于各个增强时相影像组学特征术前预测ALN转移的价值,旨在探索适合模型建立的最佳DCE-MRI增强时相选择。姜原等[24]通过主成分分析获得的融合特征(包括影像组学特征和临床特征)构建ALN转移诊断模型,其AUC值、准确度分别为0.767和77.1%,略低于本研究中的预测模型,可能与其样本量较少(163例)或训练集和测试集分组比例不同有关。另外,有研究[29]表明肿瘤周围区域可能提供有价值的结果相关信息,LIU等[30]通过SVM构建DCE-MRI影像的瘤内、瘤周和瘤内联合瘤周三种影像组学模型,结果显示瘤内联合瘤周影像组学模型的预测效能最佳(验证集AUC为0.785)。此外,YANG等[31]建立基于X线影像组学特征预测ALN转移的AUC值为0.875,并且联合临床病理危险因素构建了列线图,其C指数为0.809。本研究较YANG等[31]研究结果偏低,后期可考虑联合其他序列或扩展瘤周影像组学特征提高模型的预测效能。此外,深度学习通过建立类似神经网络的非线性深度分层模型结构,自动进行特征提取及学习,对于构建乳腺癌ALN术前诊断模型也具有较大价值[32, 33]。
本研究在影像组学特征筛选及模型构建时选择多种不同的算法,且每个步骤均以排列组合方式进行多种尝试,并根据最终结果选取最佳预测模型。初步研究结果表明基于DCE-MRI影像组学特征有助于乳腺癌术前预测ALN转移。但本研究也存在一定的局限性。首先,本研究中所入组的病理类型相对单一,均为非特殊类型浸润性乳腺癌;其次,在影像组学特征提取时未进行图像归一化和重采样等预处理,未能消除成像参数潜在的不均一性;最后,本研究是回顾性单中心研究,可能存在选择偏倚,后续我们将开展多中心研究进一步外部验证研究结果。
综上所述,基于DCE-MRI的影像组学特征预测乳腺癌ALN转移具有较好的预测性能,有望成为术前无创性评估ALN状态的新方法。
王贇霞, 尚怡研, 郭亚欣, 等. DCE-MRI影像组学特征在预测乳腺癌腋窝淋巴结转移中的价值[J]. 磁共振成像, 2023, 14(3): 21-27.
WANG Y X, SHANG Y Y, GUO Y X, et al. Value of DCE-MRI based radiomics features for prediction of axillary lymph node metastasis in breast carcinoma[J]. Chin J Magn Reson Imaging, 2023, 14(3): 21-27.
Natural Science Foundation of Henan Province (No. 202300410081); Medical Science and Technological Project of Henan Province (No. LHGJ20220055).
全体作者均声明无利益冲突。





















