
建立不同机器学习算法的增强后T1加权图像影像组学模型,并对比不同模型鉴别肺癌与非肺癌脑转移瘤的诊断效能。
将728例肺癌脑转移瘤与126例非肺癌脑转移瘤患者按照7∶3比例随机分为训练集599例与验证集255例,所有患者增强T1加权图像导入ITK-SNAP软件,手动勾画感兴趣区(region of interest, ROI)。基于ROI进行影像组学特征提取并使用最小绝对收缩选择算子进行特征筛选。基于显著特征,分别建立支持向量机(support vector machines, SVM)、随机森林(random forest, RF)和逻辑回归(logistics regression, LR)模型,采用受试者工作特征(receiver operating characteristic, ROC)曲线评估模型对肺癌脑转移瘤及非肺癌脑转移瘤的鉴别诊断效能。
经过特征筛选后最终保留5个显著特征,诊断效能最好的SVM影像组学模型在训练集中的ROC曲线下面积(area under the curve, AUC)为0.796,准确度为85.3%,敏感度为87.8%,特异度为70.8%,验证集中的AUC为0.789,准确度为90.2%,敏感度为95.4%,特异度为59.5%。
基于增强MR影像组学模型可用于预测原发灶不明脑转移瘤的肺癌与非肺癌原发灶肿瘤类型,SVM模型诊断价值高于RF及LR模型。
本刊刊出的所有论文不代表本刊编委会的观点,除非特别声明
脑转移瘤是成人最常见的脑肿瘤,据报道10%~40%的肿瘤患者在其临床病程中会发生脑转移瘤,是导致癌症患者病死率高的重要因素[1];而且由于恶性肿瘤治疗技术及MRI早期诊断的进步,过去20年间脑转移瘤的发病率显著增加[2, 3]。肺癌是恶性肿瘤患者死亡的主要原因,占所有癌症死亡人数的近四分之一[4],且肺癌占脑转移性全身系统恶性肿瘤的50%,是脑转移瘤中最常见的原发肿瘤来源[5]。基于不同的原发肿瘤组织学类型的肿瘤生物学、治疗策略和预后评估的差异,区分不同肿瘤原发灶来源的脑转移瘤对其个性化诊疗至关重要[3]。有时在诊断其原发肿瘤部位之前会先检测到脑转移瘤,尤其是对于一些肿瘤患者可能仅会出现神经系统症状时,例如因头痛进行脑部MRI扫描,以及其他在确认其原发性肿瘤之前对脑转移瘤进行影像学诊断的情况。对于原发灶不明的脑转移瘤患者,由于肺癌作为最常见的恶性肿瘤且发病率逐年上升并且作为脑转移瘤主要的原发灶来源[4, 5],同时脑转移瘤的治疗和预后高度依赖于原发肿瘤的分子特征,非常需要对肺癌与非肺癌脑转移瘤类型进行非侵入性可靠分类,准确判断其原发灶是否源于肺癌有助于辅助临床实现更早期便捷的个体化治疗管理,有可能在临床为患者节约时间与经济成本及有效避免胸部检查造成辐射损害中提供一定的辅助[6]。
大多数脑转移瘤是通过MRI扫描诊断的,而原发肿瘤的诊断涉及一系列耗时的影像采集和危险的侵入性活检[7, 8]。因此,如果可以通过脑转移瘤的MRI图像推断其原发肿瘤,将具有较高的临床意义,不但可提高MRI检查的价值,而且有助于加速诊疗决策过程并且在一定程度上减轻患者心理负担。MRI为无创诊断脑转移瘤的金标准[3],虽然脑转移瘤的MRI影像学表现与其原发肿瘤的病理类型呈正相关[9],但仅凭视觉观察仍难以准确鉴别其原发灶。影像组学特征致力于将脑转移瘤的影像学特征与肺癌病理类型相关联,可以弥补上述不足[10]。增强后T1加权成像(T1 weighted imaging, T1WI)是诊断脑转移瘤常规易得的最佳序列,可以提供脑转移瘤病变内的血管分布信息[11],因其能很好地反应肿瘤血供非均质性特点而具备较好的诊断性能,在脑转移瘤诊疗中有重要价值[12]。所以本研究通过MRI影像组学客观定量化肉眼无法感知的成像表型特征[12],基于不同机器学习模型从而达到鉴别脑转移瘤原发灶的目的[13, 14]。已有研究证实了影像组学在脑转移瘤的鉴别诊断[15, 16]、原发肿瘤的鉴别[17, 18]及预后预测[18, 19, 20, 21]等方面的研究价值。与仅有的少量脑转移瘤影像组学研究[22, 23, 24]集中在开发模型以区分不同的原发性癌症相比,本研究目的是基于更大的数据集提取MRI影像组学特征来识别脑转移瘤的主要起源部位,从而能够应用较为成熟的多种机器学习模型来建立重复性及泛性化较好的增强MRI影像组学模型进行肺癌脑转移瘤与非肺癌脑转移瘤的鉴别,进而探讨出最佳的影像组学模型。
回顾性连续速集2015年1月至2021年6月河北大学附属医院收治的854例肺癌脑转移瘤及非肺癌脑转移瘤患者的MRI T1WI图像及临床信息。纳入标准:(1)脑转移瘤病例仅有单一原发肿瘤;(2)肺癌或非肺癌的原发肿瘤组织病理学经手术或穿刺得到病理学证实;(3)脑转移瘤病灶通过活检、手术或影像学确诊。排除标准:(1)既往共存其他恶性肿瘤史;(2)颅脑MR增强图像质量不佳及有颅脑手术病史者。本研究遵守《赫尔辛基宣言》,且经河北大学附属医院伦理委员会批准,免除受试者知情同意,批准文号:HDFY-LL-2022-084。病例数据获取及处理流程如图1所示。


MRI检查在河北大学附属医院进行,且使用多台不同的MR扫描仪(1.5、3.0 T MR),反应了图像数据的异构性,包括1.5 T Amira MR扫描仪(Siemens,德国)、1.5 T Achieva MR扫描仪(Philips,荷兰)及3.0 T Discovery 750 MR扫描仪(General Electric Company,美国)。头颅MRI轴位增强后T1WI序列,以钆喷酸葡甲胺盐(Gadopentetic acid, Gd-DTPA)为对比剂,采用高压注射器以0.01 mmol/kg(0.2 mL/kg)的剂量经肘静脉以2 mL/s的速率注射。Siemens扫描参数:T1WI轴位,TR 166 ms,TE 1.7 ms,激励次数4,FOV 23 cm×35 cm。Philips扫描参数:T1WI轴位,TR 25 ms,TE 4.6 ms,激励次数 1,FOV 23 cm×35 cm;General Electric Company扫描参数:T1WI轴位,TR 195 ms,TE 4.7 ms,激励次数 1,FOV 24 cm×36 cm。层厚均为5.0 mm,层间距均为1.0 mm。
MRI影像组学的处理步骤包括图像分割、特征提取、筛选及建立组学模型(图1)。数据采用随机分层抽样按照7∶3分为训练数据集和验证数据集。
所有图像数据均从图片存档和通信系统(picture archiving communicating system, PACS)中读取,图像数据以DICOM格式保存,根据由一名初级放射科医师书写及具有高级职称的放射科医师审核的MRI诊断报告,应用ITK-SNAP软件(版本3.8.0,www.itksnap.org)在患者轴位增强后T1WI中进行勾画感兴趣区(region of interest, ROI),如图2所示。ROI勾画标准:(1)勾画边界为病灶内侧缘1~2 mm以内;(2)脑转移瘤病灶进行逐层逐个勾画;(3)尽可能避开周围水肿或其他组织。


首先对图像进行预处理,包括图像体素归一化(1 mm×1 mm×1 mm)、图像灰度zscore标准化。随后将标准化后的图像及勾画好的ROI文件导入AK软件(版本3.3.0,Artificial Intelligence Kit,GE Healthcare,China)进行特征提取,包括直方图参数特征、形状特征、灰度共生矩阵特征、灰度游程长度矩阵特征及滤波小波特征。
为防止出现过拟合的问题,需对影像组学特征进行筛选。使用Z-score方法对所有特征进行标准化处理。应用最小绝对收缩选择算子(least absolute shrinkage and selection operator, LASSO)和逐步多因素逻辑回归进行特征筛选。利用支持向量机(support vector machines, SVM)、随机森林(random forest, RF)和逻辑回归(logistics regression, LR)算法分别建立鉴别肺癌脑转移瘤和非肺癌脑转移瘤影像组学预测模型,采用测试集数据进行模型效能评估。
采用R软件(版本3.6.3,www.rporject.org)进行所有的统计学分析。对于计数资料以例(%)形式表示,使用Mann-Whitney U检验或t检验对连续变量和卡方检验对组间差异进行评估。受试者工作特征(receiver operating characteristic, ROC)曲线用于评估及比较基于SVM、RF及LR算法的影像组学模型区分肺癌脑转移瘤及肺癌脑转移瘤的效能。<0.05认为差异具有统计学意义。
本研究共收集数据854例,其中肺癌脑转移瘤患者728例,男447例,女281例,年龄24~82(60.67±9.61)岁;非肺癌脑转移患者126例(原发肿瘤:乳腺癌78例、胃肠道肿瘤14例、食管癌13例、肾癌7例、子宫卵巢癌7例、恶性黑色素瘤5例、肝癌及鼻咽癌各1例),女99例,男27例,年龄29~82(56.87±11.07)岁;训练集及验证集的数据分布详见表1。训练集和验证集中患者性别、年龄、不同原发灶的脑转移的差异均无统计学意义。

训练集和验证集临床数据
Characteristics of enrolled patients in the training and testing data sets
训练集和验证集临床数据
Characteristics of enrolled patients in the training and testing data sets
| 变量 | 训练集(n=599) | 验证集(n=255) | 统计值 | P值 |
|---|---|---|---|---|
| 性别/例(%) | 0.356① | 0.551 | ||
| 女 | 271(45.2) | 109(42.7) | ||
| 男 | 328(54.8) | 146(57.3) | ||
| 年龄/岁 | 58.87±9.82 | 60.67±10.2 | -2.463② | 0.096 |
| 不同原发灶的脑转移/例(%) | 0.001① | 0.979 | ||
| 非肺癌脑转移瘤 | 89(14.9) | 37(14.5) | ||
| 肺癌脑转移瘤 | 510(85.1) | 218(85.5) |
注:①表示采用χ2检验;②表示采用独立样本t检验。
基于脑转移瘤增强后T1WI共提取影像组学特征1037个,应用LASSO(筛选如图3)和逐步多因素逻辑回归进行特征筛选,最终选择出5个显著特征(表2)。基于筛选出的5个显著影像组学特征建立SVM、RF及LR影像组学模型,应用ROC曲线进行诊断效能评估(图4),分别计算相应的ROC曲线下的面积(area under the curve, AUC)、准确度、敏感度、特异度、阳性预测值(positive predict value, PPV)及阴性预测值(negative predict value, NPV)用以评估模型的定量分类效能(表3)。基于增强后T1WI的SVM影像组学模型在鉴别肺癌脑转移瘤及非肺癌脑转移瘤方面表现出最佳性能,在训练集及验证集中均获得了最优指标,AUC分别为0.796(95% CI:0.736~0.856)、0.789(95% CI:0.698~0.881),准确度分别为85.3%、90.2%,敏感度分别为87.8%、95.4%,特异度分别为70.8%、59.5%,PPV分别为0.945、0.933及NPV分别为0.504、0.688。相比之下,LR及RF模型的性能略差,训练集中,RF及LR模型的AUC分别为0.706(95% CI:0.643~0.769)、0.720(95% CI:0.662~0.778),敏感度分别为79.0%、78.2%;验证集中,AUC分别为0.670(95% CI:0.570~0.770)、0.692(95% CI:0.597~0.788),敏感度分别为82.6%、77.1%。LR模型的AUC对比RF和SVM的AUC delong检验P值在训练集中分别为0.578、0.024,在验证集中分别为0.561、0.029;RF模型的AUC对比SVM的AUC delong检验P值在训练集为0.026,在测试集中为0.04。



最优影像组学特征
Optimal radiomic features
最优影像组学特征
Optimal radiomic features
| 序号 | 特征 |
|---|---|
1 2 3 4 5 | log.sigma.3.0.mm.3D_glcm_InverseVariance wavelet.LLH_glrlm_RunEntropy wavelet.LHL_firstorder_Maximum wavelet.LHH_glrlm_LongRunEmphasis wavelet.HLL_firstorder_Skewness |



SVM、RF及LR模型的分类效能
Models performance comparison of SVM, RF and LR
SVM、RF及LR模型的分类效能
Models performance comparison of SVM, RF and LR
| 指标 | 训练集 | 验证集 | ||||
|---|---|---|---|---|---|---|
| LR模型 | RF模型 | SVM模型 | LR模型 | RF模型 | SVM模型 | |
| AUC(95% CI) | 0.706(0.643~0.769) | 0.720(0.662~0.778) | 0.796(0.736~0.856) | 0.670(0.570~0.770) | 0.692(0.597~0.788) | 0.789(0.698~0.881) |
| 准确度/% | 75.8 | 75.6 | 85.3 | 76.5 | 73.7 | 90.2 |
| 敏感度/% | 79.0 | 78.2 | 87.8 | 82.6 | 77.1 | 95.4 |
| 特异度/% | 57.3 | 60.7 | 70.8 | 40.5 | 54.1 | 59.5 |
| 阳性预测值 | 0.914 | 0.919 | 0.945 | 0.891 | 0.908 | 0.933 |
| 阴性预测值 | 0.323 | 0.327 | 0.504 | 0.283 | 0.286 | 0.688 |
注:SVM为支持向量机;RF为随机森林;LR为逻辑回归;AUC为受试者工作特征曲线下面积;CI为置信区间。
本研究基于854例脑转移瘤病例分别应用LR、RF及SVM算法构建增强后T1WI影像组学模型区分肺癌脑转移瘤与非肺癌脑转移瘤,并比较3种模型的诊断效能,结果表明SVM模型性能更稳健,在训练集及验证集中均获得了最优指标,AUC分别为0.796、0.789。本研究的优势是以较大的数据集为依托,基于脑转移瘤的增强后T1WI应用多种机器学习模型建立影像组学模型进行量化验证,有利于进一步验证及挖掘MRI影像组学准确寻找脑转移瘤原发灶的潜力,从而有助于提高诊断的准确性并简化诊疗工作流程。
本研究纳入的MRI数据是从患者的常规临床评估中连续收集的,肺癌脑转移瘤及非肺癌脑转移瘤数据比例相差较大,数据基本符合肺癌是最常见的脑转移肿瘤的流行病学表现(约占50%),其他来源的脑转移瘤囊括了不同部位的原发肿瘤,且分布情况也与流行病学基本相符(乳腺癌占15%~20%、黑色素瘤占5%~10%、肾癌占7%和结肠癌占4%~6%)[5],本研究中854例脑转移瘤患者,其中肺癌脑转移瘤占了绝大多数,而除肺癌以外其他非肺癌肿瘤脑转移瘤,诸如乳腺癌、胃肠道肿瘤、黑色素瘤和其他来源的脑转移瘤病例数有限只约占总样本量的七分之一,基于本研究数据的以肺癌脑转移瘤为主的特征,同时由于除肺癌以外肿瘤来源的数据过少,基于本研究的数据量无法细化除肺癌以外的分类,所以本研究基于脑转移瘤MRI影像组学鉴别肺癌脑转移瘤与非肺癌脑转移瘤。本研究主要是针对原发灶是肺癌的脑转移瘤是具有重要临床实践意义的,因为肺癌是脑转移瘤最常见的来源,非侵入性可靠区分肺癌与非肺癌脑转移瘤原发肿瘤类型在脑转移瘤的治疗中具有关键价值[6]。可以确保获得较大的数据集以构建泛化性较好的影像组学模型,避免数据量过小导致结果偏倚及可信度较差的问题,同时有可能为克服技术层面的局限性和在临床实践中的推广提供一定的帮助,可为个人治疗计划提供较为可靠的术前依据,以增加影像组学在肺癌脑转移瘤诊断和治疗评估中的补充价值。
影像组学分析在将MRI图像特征与组织病理学变化相关联方面具有巨大的潜力,应用于MRI图像解决以前放射科医师仅靠眼睛难以或不可能解决的问题[14],所以MRI影像组学可作为一种非侵入性技术,用于区分脑转移瘤的主要原发灶起源部位[22, 23, 24]。本研究旨在基于常规易得的MRI序列建立最佳影像组学模型来区分肺癌脑转移瘤的非肺癌脑转移瘤。由此可见,基于增强后T1WI影像组学分析利用最简便准确的MRI序列图像,不仅可以简化诊疗流程,快速定位脑转移原发灶,还有利于减轻患者负担,尤其是为原发灶不明确的脑转移瘤患者的后续临床治疗提供客观有效的辅助信息。以往基于脑转移瘤的增强CT影像组学研究表明[16, 17],虽然脑增强CT作为初始筛查成像方式,与MRI平行检测脑转移瘤也是必不可少的,二者联合应用得以实现非小细胞肺癌脑转移患者的最佳治疗管理,但是,CT对脑转移瘤的检测敏感性明显低于MRI,应仅限于有MRI禁忌证的患者[4]。Cao等[25]分析了78例脑转移瘤患者的治疗前脑增强CT和增强MRI图像以区分肺癌脑转移瘤和乳腺癌脑转移瘤,基于单独CT、单独MRI以及二者组合的二元逻辑回归和SVM影像组学模型的AUC在测试集中分别为0.708、0.763,0.715、0.717及0.771、0.805,结果表明基于MRI的影像组学模型诊断效能略优于基于CT的影像组学分析。所以,本研究基于MRI影像组学分析相较于CT组学分析是具有一定优势的,有助于本研究获得泛化性较好的影像组学模型。
增强后T1W序列作为脑转移瘤影像诊疗最常规应用的最佳序列[3],使得本研究建立的增强后T1WI影像组学预测模型具有较高的临床推广价值。基于增强后T1WI影像组学分析已应用于脑转移瘤的相关研究中。Ortiz-Ramón[22]等对各50例脑转移瘤和胶质母细胞瘤的增强后T1WI进行影像组学分析,AUC可达0.896。Li等[26]的研究已证实基于增强T1W序列影像组学能有效区分肺癌脑转移瘤的病理分型,且诊断效能优于弥散加权序列。李瑞[17]等通过建立多参数影像组学模型,增强T1WI预测模型在鉴别脑转移瘤原发病灶的不同病理类型方面效能较好(AUC为0.81)。以上研究均表明Gd-DTPA能增强脑转移病灶与周围组织的对比度,可以很好地反映脑转移瘤边缘区域和肿瘤强化程度不同所致的信号变化,因此其可以反映肿瘤血供的非均质性特点,进而更有利于捕获病灶的异质性,从而使得建立的MRI影像组学模型在一定程度上可能会更稳健[12]。虽然之前Park等[20]联合弥散张量成像及增强T1WI的脑转移瘤MRI影像组学基因方面的研究分析取得了较好的诊断效能,然而,这些先进的成像序列并没有普遍执行与应用,常规成像仍然是临床实践中的支柱。仅有少数研究探索了增强MRI影像组学分析在脑转移瘤的原发肿瘤鉴别方面的研究。Béresová等[23]分析了32例肺癌和26例乳腺癌脑转移患者的增强T1WI的2D和3D影像组学纹理特征,结果表明能够准确区分两种肿瘤类型的结构差异。Ortiz-Ramón等[24]又进一步分析了38例脑转移瘤患者67个病灶(肺癌27个,黑色素瘤23个,乳腺癌17个)的增强后T1WI发现,3D纹理特征鉴别三种不同来源的AUC均大于0.9。以上研究证实了增强MRI影像组学分析区分脑转移瘤不同原发肿瘤的能力,虽然取得了较高的诊断效能,但都存在研究样本过小致使影像组学模型的重复性相对较差的缺陷[27]。而本研究虽然只使用常规增强后T1WI影像组学特征来识别肺部起源的脑转移瘤,但这样可以保证足够的样本量,弥补数据量过小导致MRI结果偏倚及可信度较差的缺陷,从而可在一定程度上可以确保建立泛化性更好的影像组学模型。也有研究基于多参数MRI图像对脑转移瘤进行影像组学分析。Kniep等[28]搜集了单中心回顾性数据包括189名患者(乳腺癌143个、小细胞肺癌151个、非小细胞肺癌225个、胃肠道癌50个和黑色素瘤89个)的脑转移瘤病灶,基于多序列(T1WI、增强T1WI、FLAIR)的五分类RF模型中,AUC介于0.64~0.82之间,结果表明机器学习的预测性能优于放射医师的诊断结果,对预测脑转移瘤的类型具有较高的判别准确率,但是该研究样本量较小,尤其是除肺癌脑肿瘤以外的其他脑转移瘤患者数量更少,使得除肺癌以外的多分类影像组学模型缺乏足够的数据进行训练验证。虽然多个MRI序列能从多个方面为影像组学建模提供较为全面的脑转移瘤异质性信息,但是此类研究存在样本量较小的限制,导致数据的地区偏倚性问题,而且由于各类别间数据差距问题导致所得模型的重复性及泛化性差,这也是此研究模型性能欠佳的首要原因。相较而言,本研究基于单一常规增强后T1WI序列容易获得较大的数据集的同时能减少数据选择偏倚对模型的影响。
Ahn等[29]通过对61例肺癌患者的脑转移瘤的增强后T1WI采用四种不同算法进行建立模型以提高预测EGFR突变的诊断性能,结果显示RF预测模型诊断效能最好(AUC为86.81%)。Zhao[30]等基于增强后T1WI及FLAIR序列采用LASSO构建三种影像组学模型(SVM、RF和K-最近邻)以区分原发性中枢神经系统淋巴瘤和脑转移(肺和非肺来源),RF模型性能最佳,AUC为0.73。由此可见,本研究同样采用LASSO联合三种常见且较为成熟的算法(LR、RF及SVM)来建立增强后T1WI影像组学模型区分脑转移瘤肺癌与非肺癌原发灶的可行性,并取得了较为满意的结果,性能最佳的SVM模型在训练集的AUC为0.796(95% CI:0.736~0.856)。SVM是一种基于统计学习理论的相对较新的方法,用于解决分类和回归问题[31]。Artzi[32]等基于增强后T1WI应用多种机器学习算法能较好地鉴别胶质母细胞瘤和不同来源的脑转移瘤,结果显示SVM模型获得最佳的诊断效能(AUC为0.96)。这与本研究研究结果相符合,最好的分类结果是SVM模型获得的,优于LR及FR模型。Cao等[25]及Qian等[33]的研究结果也显示SVM联合LASSO模型具有最高的预测性能。有研究对比多种MRI影像组学模型在脑转移瘤鉴别诊断方面的效能,结果证实LASSO优化并减少模型选择中的偏差,从而提高模型的泛化性[34]。这与本研究方法一致,即最好的分类结果是由SVM模型获得的,且优于其他模型(LR及FR模型),证明了研究算法的可靠性。本研究SVM模型的效能尚可,在验证集中实现了较高的准确度、敏感度及特异度(均大于0.9),表明此模型在鉴别肺癌脑转移瘤方面具有一定的可靠及稳健性,对应用于不同临床环境具有重要参考价值。
本研究存在以下局限性:首先,本研究采用传统手动勾画ROI,大规模的数据处理耗时久且可能导致稳定性较差,而自动边界提取方法对所有病灶的结果并不令人满意,一种具有高重复性和准确性的自动分割方法将是未来的一个重要研究方向;其次,本研究肺癌脑转移瘤及非肺癌脑转移瘤的数据比例相差很大,导致数据存在的偏态较严重,这也是导致模型效能不很理想的重要原因,大幅增加非肺癌脑肿瘤类别的患者数量,可能会显著改善分类结果;再次,本研究只纳入了脑转移瘤最常见的原发肿瘤(肺癌),而其他来源的脑转移瘤未细化样本分类,将所有可能的原发肿瘤都纳入研究并建立可靠的预测模型,需今后大规模多中心数据为支撑;最后,本研究仅基于单一MRI序列,在保持大样本量的同时包含多序列MR数据组学分析有望进一步提高分类效能。
综上所述,本研究基于多种算法建立脑转移瘤增强MRI影像组学模型来鉴别肺癌脑转移瘤与非肺癌脑转移瘤,以较大的样本量为依托结果证实SVM影像组学模型具有更好的泛化性及重复性,为进一步验证MRI影像组学分析预测脑转移瘤不同原发肿瘤的可行性提供了补充依据,从而可作为临床加速诊疗决策过程的非侵入性辅助工具。
Post-graduate's Innovation Fund Project of Hebei University (No. HBU2022ss024).
全体作者均声明无利益冲突。





















