
本文旨在探究MRI多序列模型融合(multi-sequence model fusion,MSMF)影像组学模型对局部晚期鼻咽癌患者同步放化疗(concurrent chemoradiotherapy,CCRT)的疗效进行预测的价值。
本研究共纳入154例局部晚期鼻咽癌患者。患者均接受CCRT的治疗及MRI检查。采用RESIST 1.1评估治疗后的反应,分为完全反应组(83例)、非完全反应组(71例)。将数据按3∶1的比例随机分为训练集和验证集,手动分割各序列图像的感兴趣区域。使用Matlab 2018a软件分别从三个序列中各提取9766个影像组学特征,通过t检验、最大相关最小冗余算法筛选特征,采用支持向量机、Logistic回归分别构建预测模型,绘制ROC曲线,采用Delong检验比较预测性能。
在验证集中,临床模型、T1WI、T2WI、对比增强T1加权成像模型的曲线下面积(area under the cure,AUC)值分别为0.542、0.633、0.711、0.842 (P值分别为0.661、0.161、0.026、<0.001)。多序列融合模型中MSMF、临床-MSMF模型的AUC值分别为0.896、0.867 (两者P<0.05)。MSMF、临床-MSMF影像组学模型在预测局部晚期鼻咽癌患者对CCRT疗效反应的AUC显著高于T2WI、T1WI及临床模型,差异具有统计学意义(P<0.05)。
MSMF影像组学模型预测CCRT疗效的能力优于常规单一序列影像组学预测模型及临床模型,因此该模型有望成为一种预测CCRT疗效的方法,进一步促进精准医疗的发展。
本刊刊出的所有论文不代表本刊编委会的观点,除非特别声明
鼻咽癌是一种头颈部的恶性肿瘤,起源于鼻咽黏膜上皮细胞,在我国南部和东南亚国家多发[1]。2020年癌症统计显示,全球鼻咽癌新增病例133 354人,死亡人数为80 008人[2]。由于解剖位置的隐蔽及症状不明显,约70%~80%的患者就诊时已是局部晚期[3]。目前,早期鼻咽癌的治疗主要通过放疗或同步放化疗(concurrent chemoradiotherapy,CCRT),局部晚期鼻咽癌主要治疗方案是CCRT或诱导化疗联合CCRT4]。随着调强放疗技术改进及化疗方案的不断优化,鼻咽癌的预后较前不断改善,但在CCRT后仍有约10%~20%的鼻咽癌患者出现局部复发[5]、约30%~40%的患者出现远处转移[6],这是导致鼻咽癌治疗失败的主要原因。因此预测患者对CCRT的反应,在治疗前对治疗方案进行调整,可以避免不必要的治疗和毒副作用。
影像组学被广泛应用于预测鼻咽癌[7, 8]、直肠癌[9]、肺癌[10]的CCRT反应等研究。Liu等[7]、Bulens等[9]的研究均表明MRI影像组学在预测鼻咽癌、直肠癌对CCRT的反应具有较高的准确率,因此MRI影像组学有望成为一种预测指标。鼻咽癌的成像方法具有多样化,主要有CT、PET/CT、MRI,目前鼻咽癌的MRI影像组学研究最热,主要原因是鼻咽癌是一种位于鼻咽部的软组织肿物,而MRI相比前两者具有更好的软组织分辨率,能更好地反映解剖与肿瘤的异质性。前人研究表明MRI在预测鼻咽癌疗效[11, 12]、预后[13]、放化疗后不良反应[14]、诊断[15]等各方面均有重要价值。但是,当前鼻咽癌的影像组学研究主要是采用传统的单模态的方法,因此很难取得理想的预测性能。融合模型是将多个影像序列或医学信息进行融合处理而建立的,能更全面反应肿瘤信息,进一步提高了预测准确性。大量研究表明,融合模型在预测疗效[16]、转移与复发[17]、疾病诊断[18]、预测组织学分型[19]、区分良恶性结节[20]等方面发挥重要作用。
目前利用融合模型来预测鼻咽癌疗效的模型不多,且在新辅助化疗[11, 12,21]中比较多见,而融合模型预测鼻咽癌CCRT疗效的文章在国内外尚未见报道。因此,本研究旨在探究MRI的多序列模型融合(multiple sequence model fusion,MSMF)影像组学模型预测局部晚期鼻咽癌患者对CCRT的治疗反应的价值。
本研究为回顾性研究,该研究方案已获得广西医科大学附属肿瘤医院伦理委员会的批准,免除受试者知情同意,批准文号:LW2022002。回顾性分析广西医科大学附属肿瘤医院2015年1月至2019年12月的局部晚期鼻咽癌患者临床资料。纳入标准为:(1)经病理活检确诊非角化型鼻咽癌;(2)初诊局部晚期(Ⅲ、Ⅳ期;分期采用第八版国际抗癌联盟/美国癌症联合委员会分期手册)鼻咽癌患者;(3)有完整的CCRT前、后MRI图像[包括3个序列,分别为T1WI、T2WI、对比增强T1加权成像(contrast enhanced T1 weighted imaging,CE-T1WI)],MRI扫描分别在治疗前1周内、治疗后2周内完成检查,且图像质量好;(4)有完善的临床信息(包括白细胞、血红蛋白、血小板等);(5)所有患者均接受CCRT的治疗方案;(6) CCRT治疗前肿瘤体积可测量。排除标准:(1)合并其他癌症(如乳腺癌、肝癌);(2)本次治疗前有过放化疗史、手术切除史的患者。
所有患者的治疗方案均符合中国临床肿瘤协会鼻咽癌诊疗指南。同步化疗采用铂类(顺铂100 mg/m2或洛铂30 mg/m2)单药同步化疗,每3周1次,行1~3个周期。调强放疗采用6MV线性加速器,总剂量70.4~72.6 Gy,每次2.0~2.2 Gy,共照射30~33次,每天1次,每周5次,连续6~7周。在CCRT前给予诱导化疗,方案为TPF (多西他赛60 mg/m2,顺铂60 mg/m2,5-FU 600 mg/m2)、TP (多西他赛75 mg/m2,顺铂60 mg/m2)或GP(吉西他滨1000 mg/m2,顺铂80 mg/m2)方案。本研究使用的药剂包括:顺铂注射液(江苏豪森药业股份有限公司,中国);洛铂注射液(海南长沙国际制药有限公司,中国);多西他赛注射液[赛诺菲安万特(杭州)有限公司];吉西他滨(江苏豪森药业股份有限公司,中国);5-FU (上海旭东海普药业有限公司,中国)。
两位具有10年诊断经验的放射科医生(主治医师、主任医师)根据实体肿瘤标准(response evaluation criteria in solid tumors,RECIST 1.1[22])对CCRT后的MRI图像进行治疗反应评估,分为完全缓解(complete response,CR)、部分缓解(partial response,PR)、疾病进展(progressive disease,PD)、疾病稳定(stable disease,SD)。我们定义CR为完全反应组,PR、SD、PD为非完全反应组。意见不一致时,协商达成一致结果。图1为鼻咽癌治疗前后MRI图像。


使用磁共振成像设备(MAGNETOM AVANTO 1.5 T,西门子,德国或者DISCOVERY MR750 3.0 T,GE,美国)及自带头颈组合线圈进行图像扫描,扫描范围从锁骨至鞍上池上缘。扫描结束后从影像归档和通讯系统采集CCRT前T1WI、T2WI、CE-T1WI三个序列MRI图像,并以DICOM格式导出。1.5 T MRI扫描参数如下:T1WI:TR/TE 957 ms/19 ms,矩阵256×256;CE-T1WI:TR/TE 885 ms/19 ms,矩阵 256×256;T2WI_FS:TR/TE 6760 ms/91 ms,矩阵 768×696;三种序列其余参数一致:层厚5 mm,层间距1 mm,FOV 374 mm×240 mm。3.0 T MRI扫描参数如下:T1WI:TR/TE 610 ms/12 ms;CE-T1WI:TR/TE 4748 ms/65 ms;T2WI_FS:TR/TE 682 ms/10 ms;三种序列其余参数一致:矩阵 512×512,层厚5 mm,层间距1 mm,FOV=374 mm×240 mm。增强扫描前患者静脉注射对比剂钆特酸葡胺[钆特酸葡胺注射液,国药准字H20153167,15 mL (5.654 g,以钆特酸葡胺计),江苏恒瑞医药股份有限公司,中国,剂量:0.2 mL/kg]。
由两位具有10年诊断经验的放射科医师使用ITK-SNAP软件(版本号:3.8.0 http://www.itksnap.org)逐层勾画治疗前T1WI、T2WI、CE-T1WI三个序列的鼻咽癌肿瘤原发灶并审查,从而获得三维容积感兴趣区域(region of interest,ROI),并且两名放射科医生对患者临床信息不知情,对于有歧义的区域通过讨论解决。研究流程如图2所示。


使用Matlab 2018a软件进行特征提取,分别提取T1WI、T2WI、CE-T1WI三个序列的图像特征。为了增强提取的放射组学特征的鲁棒性和可复制性,本研究采用小波带通滤波、各向同性重采样、灰度离散等方法获取各种放射组学特征。首先,在小波域下设置了5个不同的带通子带系数,小波相关带通子带系数分别定义为0.5、0.67、1.0、1.5、2.0,从而可以在不同的小波尺度下提供更多的成像特征。然后,对不同序列的MRI影像进行图像采样标准化[23]处理,在各向同性重采样中,通过三次插值对ROI进行重新采样,以获得不同尺寸下的适当分辨率,尺寸分别设置为0.9、1、1.2、1.5和2。最后,采用灰度离散化法获得噪声抑制特性,灰度级分别设置为8、16、32和64。
将数据按3∶1的比例随机分为训练集和验证集。随后对特征进行选择,首先采用独立样本t检验方法进行特征的初步筛选,选择具有统计学意义的特征(P<0.05)。最后,使用R软件通过最大相关最小冗余算法进行特征二次选择,得到疗效相关的最小冗余的影像组学特征。
首先,将筛选出的特征通过支持向量机(support vector machine,SVM)建立了临床模型及分别基于T1WI、T2WI、CE-T1WI序列的影像组学模型等4个预测模型。相比其他类器,SVM对于线性不可分的情况能更好地进行分类,通过线性非映射算法降低空间数据维度,将其转化为高维度空间特征。
然后,本研究还将T1WI、T2WI、CE-T1WI输出的模型加权融合建立MSMF模型。该模型基于各个序列建模的AUC值进行权重分配,见公式(1)。
表示第i个模型分配的权重,表示第i个模型的AUC,表示三个模型AUC的总和。
加权融合是对单个序列模型进行线性加权并将分类结果整合[24]。最后,本研究尝试将影像组学与临床信息结合建模,以此得到多模态特征预测模型,将基于上述分类性能最优的MSMF模型生成输出值作为影像组学评分(Rad-score),采用Logistic回归将Rad-score和临床信息融合进行建模建立了临床-MSMF模型[13]。
使用MedCalc软件(20.106版本,德国)绘制ROC曲线。使用SPSS 23.0软件(IBM SPSS Statistics 23.0,美国)进行统计学分析,分类资料用卡方检验进行分析,计量资料符合正态分布、非正态分布分别用t检验、曼-恵特尼U检验进行分析,双侧P值<0.05认为差异有统计学意义。使用Matlab 2018a (9.4.0版本)进行特征提取,使用R软件(4.1.2版本,http://www.r-project.org)进行特征选择、建模及Delong检验分析。
共收集154名符合标准的鼻咽癌患者资料。按肿瘤反应评估分为完全反应组(n=83)、非完全反应组(n=71)。两组的临床信息在WHO病理分型的差异有统计学意义(P<0.05),在性别、年龄、临床分期、白细胞、血红蛋白、淋巴细胞、单核细胞、乳酸脱氢酶、血小板、白蛋白、乙肝表面抗原定性、同期化疗方案的差异均无统计学意义(表1)。

完全反应组与非完全反应组的临床特征差异
Difference of clinical characteristics between complete response group and incomplete response group
完全反应组与非完全反应组的临床特征差异
Difference of clinical characteristics between complete response group and incomplete response group
| 名称 | 完全反应组(n=83) | 非完全反应组(n=71) | 值(t值、Z值或χ2值) | P值 |
|---|---|---|---|---|
| 性别 | 2.235 | 0.135 | ||
男 | 70 | 53 | ||
女 | 13 | 18 | ||
| 年龄(岁) | ||||
均值 | 41.76±10.15 | 41.33±12.11 | 0.233 | 0.816 |
范围 | 20~62 | 15~65 | ||
| WHO病理分型 | — | 0.043 | ||
未分化型 | 83 | 67 | ||
分化型 | 0 | 4 | ||
| 临床分期 | <0.001 | 0.986 | ||
Ⅲ | 27 | 23 | ||
Ⅳ | 56 | 48 | ||
| 白细胞计数(109/L) | 7.55 | 7.02 | -1.655 | 0.098 |
| 血红蛋白(g/L) | 141.50 | 138.00 | -0.831 | 0.406 |
| 淋巴细胞计数(109/L) | 1.86 | 1.79 | -0.136 | 0.173 |
| 单核细胞计数(109/L) | 0.54 | 0.48 | -2.001 | 0.045 |
| 乳酸脱氢酶(U/L) | 177.00 | 184.00 | -0.980 | 0.327 |
| 血小板计数(109/L) | 286.25±66.16 | 291.67±68.88 | -0.556 | 0.579 |
| 白蛋白(g/L) | 40.46±3.06 | 40.23±3.80 | 1.040 | 0.300 |
| 乙肝表面抗原定性 | 0.821 | 0.365 | ||
阳性 | 16 | 18 | ||
阴性 | 67 | 53 | ||
| 同步化疗方案 | <0.001 | 1.000 | ||
顺铂 | 80 | 68 | ||
洛铂 | 3 | 3 |
注:分类资料的数字代表人数,计量资料的数字代表中位数或均数±标准差。
从三个序列各提取9766个特征,包括一阶特征(n=12)、形状特征(n=4)、灰度共生矩阵(gray level co-occurrence matrix,GLCM)特征(n=9)、灰度大小区域矩阵(gray level size zone matrix,GLSZM)特征(n=13)、灰度游程矩阵(gray level run length matrix,GLRLM)特征(n=13)、邻域灰度差矩阵(neighbouring gray tone difference matrix,NGTDM)特征(n=5)、小波特征。随后,将特征通过t检验筛选,获得T1WI、T2WI、CE-T1WI的特征分别为4505、3810、5481个。最后,使用R软件二次选择得到40个的高度相关的非冗余特征,最后将筛选出的非冗余特征用于后续的建模。
本研究在训练集和验证集通过SVM及Logistic回归分别建立了六个预测模型,各模型的ROC曲线、AUC值、敏感度、特异度、95%置信区间、P值如图3、表2所示。



训练集和验证集模型的ROC曲线
ROC curves of training set and validation set models
训练集和验证集模型的ROC曲线
ROC curves of training set and validation set models
| 模型 | AUC值 | 敏感度 | 特异度 | P值 | 95% 置信区间 | |
|---|---|---|---|---|---|---|
| 下限 | 上限 | |||||
| T1-model | ||||||
训练集 | 0.894 | 0.921 | 0.868 | <0.001 | 0.829 | 0.960 |
验证集 | 0.633 | 0.600 | 0.667 | 0.161 | 0.476 | 0.790 |
| T1C-model | ||||||
训练集 | 0.934 | 0.905 | 0.962 | <0.001 | 0.882 | 0.985 |
验证集 | 0.842 | 0.850 | 0.833 | <0.001 | 0.722 | 0.961 |
| T2-model | ||||||
训练集 | 0.926 | 0.984 | 0.868 | <0.001 | 0.869 | 0.983 |
验证集 | 0.711 | 0.700 | 0.722 | 0.026 | 0.563 | 0.859 |
| cli-model | ||||||
训练集 | 0.813 | 0.894 | 0.642 | <0.001 | 0.728 | 0.898 |
验证集 | 0.542 | 0.750 | 0.333 | 0.661 | 0.393 | 0.690 |
| mix-model | ||||||
训练集 | 0.985 | 0.952 | 0.962 | <0.001 | 0.961 | 1.000 |
验证集 | 0.896 | 0.750 | 0.899 | <0.001 | 0.801 | 0.990 |
| cli-rad-model | ||||||
训练集 | 1.000 | 1.000 | 1.000 | <0.001 | 1.000 | 1.000 |
验证集 | 0.867 | 0.800 | 0.899 | <0.001 | 0.742 | 0.992 |
注:AUC:曲线下面积;Cli、T1、T2、T1C、mix、cli-rad分别代表临床、T1WI、T2WI、CE-T1WI、MSMF、临床-MSMF 预测模型。
在训练集中,各模型的AUC值均大于0.8,P值均小于0.05,各模型均显示出优越的预测能力,其中MSMF模型的预测CCRT疗效的能力最好(AUC=0.985)。在验证集中,结果为在CE-T1WI、T2WI、MSMF、临床-MSMF、T1WI、临床预测模型中,除T1WI、临床预测模型的P值大于0.05,其余模型的P值均小于0.05,AUC分别为0.842、0.711、0.896、0.867、0.633、0.542,结果表明基于T1WI、临床信息建立的模型不能有效预测疗效,其余模型均具有优良的预测能力,其中MSMF放射组学模型的预测疗效能力最好,临床-MSMF模型次之。
最后,采用Delong检验分析对验证集中的模型进行两两比较(图4),该图是根据Delong检验得出的检验统计量(Z值或D值)绘制的热图,可以看出临床、T1WI模型分别与CE-T1WI、MSMF、临床-MSMF预测模型及T2WI与MSMF模型两两比较的P值均<0.05,组间AUC值存在显著差异,说明CE-T1WI、MSMF、临床-MSMF预测模型在区分完全反应组与非完全反应组的能力明显优于临床、T1WI、T2WI模型;其余组间差异对比的P值大于0.05,差异不具有统计学意义,说明其余两两对比的模型在预测疗效方面的能力相当(如CE-T1WI vs. MSMF, MSMF vs.临床-MSMF)。


本研究建立了多个影像组学模型来预测局部晚期鼻咽癌对CCRT的反应,包括临床模型、影像组学模型、临床-影像组学模型,其中多序列融合模型(MSMF模型)具有优越的预测性能,该模型由T1WI、T2WI、CE-T1WI的模型融合建立,在训练集和验证集AUC值分别高达为0.985、0.896。目前基于影像组学预测局部晚期鼻咽癌疗效的研究多采用单一影像序列进行建模,而不同的影像序列能从不同角度提供更多的有利信息。本研究首次使用多序列MRI后融合模型对局部晚期鼻咽癌的疗效反应进行预测,且与传统的单一序列影像组学模型相比预测效果更佳。本研究为进一步优化影像组学模型的预测性能提供了一种新方法,既能在治疗前通过结合各种医疗信息更准确地预测CCRT疗效,为临床决策提供更好的参考依据,又能避免过度医疗和减少医疗费用;此外,本研究预测模型还能减少临床上评估疗效的主观性,在预测疗效方面具有客观性、便捷性、准确性的特点。
影像组学是一种非侵入性、定量提取图像特征的方法,可以全面地反映肿瘤的形状、空间、异质性。国内外研究[12,23,25]表明影像组学具有预测鼻咽癌疗效的重要价值。目前用影像组学预测鼻咽癌新辅助化疗疗效的研究众多[11,26],而影像组学预测鼻咽癌CCRT疗效的研究报道少见,因此本研究探究了MRI影像组学预测CCRT疗效的价值。
本研究结果发现,在验证集中临床模型和影像组学模型的AUC值分别为0.542、0.633~0.896,表明了不同的模型预测准确性有差别,并且影像组学模型的预测效果均高于临床模型。Liu等[7]研究也表明在预测鼻咽癌CCRT的能力上CE-T1WI模型优于T2WI模型,AUC分别为0.952、0.904,说明CE-T1WI序列在鼻咽癌影像组学的研究中具备较好的应用价值,但该研究AUC值高于本研究,可能原因是研究方法不同,该研究采用了机器学习,使用了K-最近邻、十折交叉验证等算法,因此本研究算法还有待进一步改进。Zhao等[11]研究结果也与本研究一致,结果表明影像组学模型、临床结合影像组学模型准确性优于临床模型。可能原因是影像组学能反映肿瘤内部的异质性[27],而临床特征不具有特异性。由此可见,影像组学可作为一种早期预测鼻咽癌疗效的有效指标,有助于早期干预以改善患者预后。
目前许多预测模型正朝着多模态融合[28]形式发展,融合能将多个医学图像或信息结合,使数据得到信息上的最大的利用及互补。研究表明了融合模型在恶性肿瘤[9,29, 30]中预测CCRT疗效有重要价值,但是目前融合模型预测鼻咽癌CCRT的研究尚未见报道。
本研究将不同序列模型按AUC进行权重分配,然后通过线性加权融合得到MSMF模型,在验证集的AUC为0.896;而单一序列T1WI、T2WI、CE-T1WI模型在验证集的AUC分别为0.633、0.711、0.842,比较发现MSMF模型的AUC值与单一序列模型相比得到较大提升,不仅说明本研究的融合方式具有可行性,还证明了MSMF模型具有比传统单一影像学模型更好的预测能力。既往研究也表明融合模型的优越性,Wang等[26]研究MRI纹理特征预测NPC诱导化疗反应,分别建立了单独CE-T1W模型和CE-T1WI、T2WI-FS、T2WI融合模型,AUC分别为0.715、0.822,敏感度分别为0.940、0.980,特异度分别为0.500、0.529,结果也表明融合模型预测能力比单一模型更好,说明采用融合模型能将不同序列影像的信息进行互补,进而提高模型的预测性能。同时,本研究也根据MSMF模型生成影像组学评分,并与临床信息进行多模态融合建模,结果表明相比于单一临床模型,临床-影像组学融合模型(临床-MSMF模型)预测效果显著提高。先前研究[12]基于MRI放射组学诺模图预测诱导化疗的疗效,结果表明结合临床与放射组学模型比单独的临床模型预测能力好,AUC分别为0.79、0.62,但本研究的临床-MSMF模型的AUC较MSMF模型的稍低,可能原因是本研究样本数量少,且临床分期只有Ⅲ、Ⅳ期,且患者的有效临床信息较少,所以导致临床-影像组学模型预测能力降低。
由此可见传统影像组学模型仅通过单一序列特征或者信息来预测疗效,不能全面反应肿瘤的信息,而本研究中MSMF模型发挥各个模型的优势,不仅整合了T1WI、CE-T1WI、T2WI反映的肿瘤的形态、解剖特征信息,还整合了CE-T1WI、T2WI反映的肿瘤的血供、含水量的情况,而肿瘤的血供、含水量往往与肿瘤的复发转移等生物学行为密切相关[31]。综上所述,融合模型在疗效预测方面潜力巨大,在未来随着分子标志物的发展,有望将影像、临床、基因、蛋白等多种信息相融合进一步提高预测能力。
本研究存在一些不足,第一,本研究未进行多中心研究,模型不具有普遍适用性,可能随着设备、医院的不同预测能力不稳定;第二,本研究只选取了CCRT前有可以测量肿瘤体积和Ⅲ、Ⅳ期的局部晚期的鼻咽癌患者,存在选择偏倚;第三,样本数量偏少,这可能导致我们的研究没能发现统计分析中存在的显著性差异,后续研究可增大样本量;第四,由于鼻咽癌侵犯的范围广,颅底结构复杂,无法自动分割,所有ROI通过手动分割,因此导致分割图像具有主观性;最后,训练集中临床-MSMF存在过拟合的现象。
综上所述,本研究验证了MSMF影像组学模型在预测CCRT疗效方面的重要价值,但仍存在不足,后续将加大样本量,进行多中心研究,并且探究新算法提高预测准确率及稳定性。
National Natural Science Foundation of China (No. 81760533); Key Laboratory Construction Project of Guangxi Zhuang Autonomous Region Health Committee (No. ZPZH2020004).
全体作者声明均无利益冲突。





















