
采用Meta分析的方法评价表观扩散系数(apparent diffusion coefficient, ADC)诊断局部晚期直肠癌新辅助治疗后完全缓解的准确性。
计算机检索PubMed、Embase、The Cochrane Library、中国知网(CNKI)、万方数据库(Wanfang Data)、中国生物医学文献数据库(CBM)和维普数据库(www.cqvip.com),收集ADC评价局部晚期直肠癌新辅助治疗疗效的研究。根据预先设定的纳入排除标准筛选文献后提取资料,并使用诊断准确性研究的质量评价工具修订版(Quality Assessment of Diagnostic Accuracy Studies 2, QUADAS-2)对纳入的研究进行方法质量学评价。排除阈值效应后计算合并的敏感度(sensitivity, SEN)、特异度(specificity, SPE)、阳性似然比(positive likelihood ratio, PLR)、阴性似然比(negative likelihood ratio, NLR)、诊断比值比(diagnostic odds ratio, DOR)等诊断性能指标,绘制森林图、分层综合受试者工作特征(hierarchical summary receiver-operating characteristic curves, HSROC)曲线,计算HSROC曲线下面积(area under the curve, AUC)及上述指标的95%可信区间(confidence intervals, CI)。
最终共纳入34个诊断性试验,包含1914例直肠癌患者,纳入研究的ADC指标包括治疗前ADC、治疗后ADC以及治疗前后ADC值的变化率,治疗前ADC的合并SEN、SPE分别是0.76(95% CI:0.62~0.86)、0.68(95% CI:0.60~0.75),治疗后ADC的合并SEN、SPE分别是0.82(95% CI:0.72~0.88)、0.77(95% CI:0.71~0.82),ADC变化率的合并SEN、SPE分别是0.83(95% CI:0.77~0.87)、0.75(95% CI:0.67~0.81)。
在不同ADC指标中,治疗后ADC以及ADC变化率诊断完全缓解的准确性较高,而治疗前ADC可用于预测肿瘤治疗反应。
本刊刊出的所有论文不代表本刊编委会的观点,除非特别声明
局部晚期直肠癌(locally advanced rectal cancer, LARC)被定义为T3或T4、伴或不伴淋巴结转移、但无远处转移的肿瘤(T3~T4和/或N+,M0)[1, 2]。目前LARC的主要治疗方式是新辅助放化疗(neoadjuvant chemoradiotherapy, nCRT)联合全直肠系膜切除术(total mesorectal excision, TME)[1, 2, 3, 4],新辅助治疗有助于LARC患者实现肿瘤降期、提高保肛率、降低局部复发率,从而提高其生存率[5, 6]。新辅助治疗后直肠癌患者可出现不同治疗反应,部分患者可出现疾病缓解,而小部分患者可能出现疾病进展[7]。LARC患者在接受nCRT后5~12周行手术治疗,然后经组织病理检查提示肿瘤完全消退被定义为病理完全缓解[8, 9, 10]。约有10%~30%直肠癌患者在接受新辅助治疗后可实现完全缓解,新辅助治疗后完全缓解组的患者与非完全缓解组的患者相比,局部复发率降低,生存率及预后有所改善[11, 12]。有研究表明新辅助治疗后达到完全缓解的患者不进行根治性手术治疗,而采用严格的随访和观察策略(watch-and-wait)是可行的,其局部无复发率、无病生存率及总体生存率与手术组相比无明显差异[11,13, 14, 15, 16]。由此可见,在新辅助治疗后手术治疗前,准确评估LARC的肿瘤反应,尤其是准确识别完全缓解有助于为患者制订侵入性较小的个性化治疗方案;并且提前预测治疗效果有助于及早调整和优化治疗[11]。
盆腔MRI能清楚地显示直肠壁各层组织及直肠周围脂肪间隙,并且通过三维重建能将各个断面的成像整合为一体[17]。高场强MRI的优点是采集图像速度快,空间分辨率和信噪比高,因此使用高场强MRI能够改善直肠壁的可见性[18]。基于对直肠成像的优势,MRI被推荐为评估直肠癌新辅助治疗疗效的首选检查方法[16, 19, 20]。
扩散加权成像(diffusion-weighted imaging, DWI)作为一种功能MRI,以水分子在细胞内外的自由扩散为基础,能够反映组织内部的微环境[21]。表观扩散系数(apparent diffusion coefficient, ADC)是评估水分子在组织内扩散的定量参数,即DWI的定量参数,其与组织细胞密度呈负相关[22]。目前大部分研究通过测量治疗前ADC值(pretreatment ADC, pre-ADC)、治疗后ADC值(posttreatment ADC, post-ADC)及治疗前后ADC变化率[ΔADC=(post-ADC-pre-ADC)/pre-ADC]评估直肠癌新辅助治疗后的肿瘤反应,然而ADC值在评估直肠癌新辅助治疗后完全缓解的诊断价值存在争议[23]。本文通过系统评价的方法,全面检索已发表的文献,评价基于ADC诊断LARC新辅助治疗后完全缓解的临床价值。
本研究的纳入标准:(1)研究类型:国内外公开发表的关于ADC评估LARC新辅助治疗疗效的诊断性研究;(2)研究对象:明确诊断为非黏液型直肠癌的患者,患者年龄、种族不限;(3)诊断标准:ADC为待评价试验,术后组织病理检查为金标准;(4)测量的结局指标:合并的敏感度(sensitivity, SEN)、特异度(specificity, SPE)、阳性似然比(positive likelihood ratio, PLR)、阴性似然比(negative likelihood ratio, NLR)、诊断比值比(diagnosis odds ratios, DOR)、分层综合受试者工作特征(hierarchical summary receiver-operating characteristic curve, HSROC)曲线下面积(area under the curve, AUC)。排除标准:(1)未报告完全缓解的研究;(2)参照诊断方法不是术后组织病理检查结果;(3)研究数据不完整不能提取诊断数据信息:真阳性(true positive, TP)、假阳性(false positive, FP)、假阴性(false negative, FN)、真阴性(true negative, TN);(4)研究计划书、社论等文献类型;(5)重复的研究;(6)无法获取全文的研究。
计算机全面检索数据库,包括中国知网(CNKI)、万方数据库(Wanfang Database)、中国生物医学文献数据库(CBM)、维普数据库、PubMed、Embase、The Cochrane Library,收集DWI诊断直肠癌新辅助治疗后完全缓解的相关文献,检索时间均由建库至2022年1月。采用自由词检索与主题词检索相结合的方法,所有检索式均通过预检后确定。英文检索词包括:“rectal cancer”“diffusion magnetic resonance imaging”“apparent diffusion coefficient”“sensitivity”和“specificity”,中文检索词包括:“直肠癌”“直肠肿瘤”“扩散磁共振成像”“敏感度”和“特异度”。同时对纳入文章的参考文献进行手动检索。
将检索的文献导入Endnote X8,首先查找并剔除重复文献,然后由2名研究者根据纳入及排除标准独立筛选文献,阅读文献题目及摘要进行初筛,再阅读全文筛选最终纳入的文献。如遇分歧,则讨论解决。对于缺乏资料的文献,尽量与原作者取得联系予以补充。
采用Office Excel 2019设计资料提取表,资料提取的主要内容包括:(1)纳入研究信息:第一作者、国家、发表年份、研究类型(前瞻性/回顾性研究);(2)病例特征:研究对象的年龄、数量、性别、MRI与新辅助治疗的时间间隔、MRI与手术治疗时间间隔;(3)诊断方法特征:ADC类型、磁场强度、是否对病理结果盲法;(4)诊断数据信息:TP、FP、FN、TN。
由2名研究者采用诊断准确性研究的质量评价工具修订版(Quality Assessment of Diagnostic Accuracy Studies-2, QUADAS-2)对纳入研究进行偏倚风险评价[24],并交叉核对,意见不一致时通过讨论解决,讨论未果则由第3名研究人员协助判断。主要评价内容包括4个领域:病例的选择、待评价试验、金标准、病例流程和时间。所有组成部分在偏倚风险方面都会被评估,前3部分也会在临床适用性方面被评估。每一条标准以“是”(低度偏倚或适用性好)、“否”(高度偏倚或适用性差)和“不清楚”(缺乏相关信息或偏倚情况不确定)评价。
首先对纳入研究进行阈值效应检验,采用Spearman相关系数判断阈值效应,若P<0.05存在阈值效应,若P>0.05则不存在阈值效应。排除阈值效应后进行Cochran-Q检验并且计算I2值,若Cochran-Q检验的P<0.05或I2>50%,表明研究间的异质性由非阈值效应所致的可能性较大,分析异质性来源,按照可能产生异质性的因素进行Meta回归分析。使用Stata 15.0软件合并效应量,本研究采用双变量混合效应模型,基于“midas”命令计算合并的SEN、SPE、PLR、NLR、DOR,并绘制HSROC曲线,计算AUC。根据AUC值评价诊断方法的价值,当AUC为0.7~0.9时表示诊断方法准确性中等,当AUC>0.9时表示其诊断准确性较高。最后使用Stata 15.0绘制Deek's漏斗图(Deek's funnel plot asymmetry test)检测是否存在发表偏倚。
计算机检索共获得文献1496篇,导入Endnote X8软件筛除重复文献442篇,通过阅读剩余1054篇文献的题目和摘要后获得可能相关文献77篇,进一步阅读全文最终纳入34个诊断试验[22,25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57]。文献筛选流程及结果见图1。


纳入文献基本特征见表1,共纳入34篇文献,共纳入LARC患者1914例,其中达到完全缓解的患者有758例。纳入文献中有5篇中文文献,29篇英文文献;18篇回顾性研究,16篇前瞻性研究。纳入文献的ADC类型主要包括pre-ADC、post-ADC及ΔADC。纳入文献中有7篇文献未提及对病理结果是否进行盲法,但所有纳入研究均以术后组织病理结果为金标准。2篇研究未报告新辅助治疗后的MRI与治疗结束间隔时间,7篇研究未报告治疗后的MRI与外科手术具体间隔时间。

纳入文献基本特征
Characteristics of included studies
纳入文献基本特征
Characteristics of included studies
| 第一作者及发表年份 | 研究类型 | 病例数(男/女) | 年龄/岁 | ADC类型 | 场强 | 盲法 | Range1 | Range2/d |
|---|---|---|---|---|---|---|---|---|
| De Felice 2017[22] | P | 28/9 | 62(42~82) | Pre/Post | 3.0 T | NR | 6 w | 7~21 |
| Bassaneze 2017[25] | R | 18/15 | 59.6±11.5 | Post | 1.5 T | Yes | (58±8.8)d | 21±13.7 |
| Blazic 2017[26] | P | 41/21 | 61.5±11.6 | Pre/Post/Δ | 1.5 T | Yes | 58 d | 10(2~23) |
| Cai 2014[27] | R | 108/37 | 56(22~78) | Post | 1.5 T/3.0 T | Yes | 5~8 w | 18(2~31) |
| Chen 2016[28] | R | 68/32 | 31~68 | Pre/Post/Δ | 3.0 T | NR | 5~11 w | <7 |
| Cho 2015[29] | R | 33/17 | 59.62±10.71 | Post | 3.0 T | Yes | 6 w | 15.1±11.5 |
| Choi 2016[30] | R | 60/26 | 63±12.1 | Post | 1.5 T/3.0 T | Yes | 38 d | 21 |
| Curvo-Semedo 2011[31] | R | 36/14 | 71.5(51~90) | Pre/Post/Δ | 1.5 T | Yes | 6~8 w | 20(4~19) |
| Delli Pizzi 2018[32] | P | 22/21 | 67.4(43~78) | Post/Δ | 3.0 T | Yes | 8 w | NR |
| Foti 2016[33] | R | 21/10 | 65(41~84) | Pre/Post/Δ | 1.5 T | Yes | [51(43~57)]d | 9(5~27) |
| Genovesi 2013[34] | P | 17/11 | 68.3(45~76) | Δ | 3.0 T | Yes | 8 w | 14 |
| Gurdal 2018[35] | P | 21/9 | 60.5(34~79) | Post | 1.5 T | NR | [9.5(8~16)]w | NR |
| Ha 2013[36] | R | 72/28 | 40~82 | Post | 1.5 T | Yes | [48(27~91)]d | NR |
| Hu 2017[37] | P | 40/16 | 52.1±11.4 | Pre/Post/Δ | 3.0 T | Yes | 7 w | 1~4 |
| Intven 2015[38] | P | 55(总数) | NR | Δ | 3.0 T | Yes | 6~9 w | 7 |
| Intven 2013[39] | R | 46/13 | 50.5~72.7 | Pre/Post/Δ | 3.0 T | NR | 6~8 w | 7~14 |
| Kim 2009[40] | R | 30/10 | 58(37~82) | Post | 1.5 T | Yes | 4~6 w | 5(1~29) |
| Kim 2011[41] | R | 49/27 | 60(34~82) | Pre/Post/Δ | 1.5 T | Yes | 4~6 w | 4(1~14) |
| Lambrecht 2010[42] | P | 17/5 | 40~80 | Post | 1.5 T | NR | 6~8 w | NR |
| Lambrecht 2012[43] | P | 16/4 | 60(40~80) | Pre/Δ | 1.5 T | Yes | 6~8 w | 7~14 |
| Liang 2019[44] | R | 46/14 | 54.63±8.5 | Pre | 3.0 T | Yes | 6~8 w | NR |
| Napoletano 2019[45] | R | 16/5 | 65(35~83) | Post | 1.5 T | Yes | [45(31~69)]d | 16(2~30) |
| Palmisano 2020[46] | P | 27/16 | 61(43~82) | Pre | 1.5 T | Yes | 8 w | NR |
| Petrillo 2018[47] | P | 62/26 | 64.6(44~84) | Δ | 1.5 T | NR | 7~9 w | 7 |
| Tarallo 2018[48] | R | 18/14 | 65.9(35~85) | Pre/Post/Δ | 1.5 T | Yes | [53.4(38~82)]d | 21.2(2~60) |
| Yang 2020[49] | R | 42/21 | 56(27~76) | Pre/Post/Δ | 3.0 T | Yes | 6~8 w | 10(0~82) |
| Yang 2021[50] | P | 27/15 | 56(27~75) | Pre/Post/Δ | 3.0 T | Yes | 6~8 w | 0~14 |
| Yang 2019[51] | R | 50/26 | 55(27~76) | Post | 3.0 T | NR | 6~8 w | 12(0~82) |
| Zhu 2017[52] | P | 64/34 | 36~80 | Post/Δ | 3.0 T | Yes | 6~9 w | 7 |
| 胡飞翔 2017[53] | P | 29/11 | 53±12 | Pre/Post/Δ | 3.0 T | Yes | NR | 1~4 |
| 苏佳娜 2020[54] | P | 32/18 | 54.4(36~73) | Post | 1.5 T | Yes | 6 w | 15(14~17) |
| 肖兰 2021[55] | R | 33/17 | 49 | Pre/Post/Δ | 3.0 T | Yes | 6~8 w | <14 |
| 肖琴 2014[56] | P | 52/18 | 55(27~7) | Pre | 3.0 T | Yes | [29(0~69)]d | NR |
| 杨岚清 2018[57] | R | 38/20 | 55.5±11.5 | Pre | 3.0 T | Yes | NR | 11 |
注:R:回顾性研究;P:前瞻性研究;Pre:新辅助治疗前行MRI检查;Post:新辅助治疗后行MRI检查;Δ:新辅助治疗前后ADC变化率;Range1:新辅助治疗结束与MRI间隔时间;Range2:MRI与手术间隔时间;NR:未报告。
纳入文献质量学评价结果见图2。偏倚风险评价方面,纳入文献中共有2篇被评价为高偏倚风险,其余为低风险或不清楚风险。临床适用性方面,所有研究在病例选择、待评价诊断试验及金标准领域均不存在临床不适用性。


共有23篇文献对完全缓解组及非完全缓解组的新辅助治疗前ADC值进行了比较(图3A),完全缓解组的pre-ADC平均值是0.931×10-3 mm2/s,非完全缓解组的平均值是0.995×10-3 mm2/s。进行Meta分析得出完全缓解组与非完全缓解组pre-ADC值相差-0.06×10-3 mm2/s(95% CI:-0.10×10-3 mm2/s~-0.02×10-3 mm2/s,P<0.001)。


共纳入25篇文献、26组数据比较了完全缓解组及非完全缓解组post-ADC值的差异(图3B),完全缓解组的post-ADC平均值是1.434×10-3 mm2/s,非完全缓解组的post-ADC平均值是1.266×10-3 mm2/s。进行Meta分析得出完全缓解组与非完全缓解组post-ADC值相差0.17×10-3 mm2/s(95% CI:0.12×10-3 mm2/s~0.23×10-3 mm2/s,P<0.001)。
共纳入17篇文献对完全缓解组及非完全缓解组治疗前后ΔADC进行了比较(图3C),完全缓解组ΔADC平均值是56.07%,非完全缓解组ΔADC平均值是28.62%,两组之间的差异是23.55%(95% CI:17.25%~29.84%,P<0.001)。
有15篇文献对pre-ADC的诊断价值进行了研究。Spearman相关系数为0.141,P=0.616,故研究间不存在阈值效应;Meta分析显示I2=89%,P<0.001,考虑纳入研究间存在非阈值效应导致的异质性。对纳入文献进行合并效应量,结果如图4A所示,pre-ADC诊断完全缓解的SEN合并是0.76(95% CI:0.62~0.86),SPE合并是0.68(95% CI:0.60~0.75),PLR合并是2.4(95% CI:1.8~3.0),NLR合并是0.35(95% CI:0.22~0.57),DOR合并是6.70(95% CI:3.49~12.83)。绘制Deek's漏斗图(图5A)得出斜率系数P=0.35,提示不存在发表偏倚。拟合HSROC 曲线,AUC=0.77(95% CI:0.73~0.80)(图6)。




通过21篇文献、23组数据分析post-ADC的诊断价值,Spearman相关系数为0.216,P=0.322,得出研究间不存在阈值效应;Meta分析I2=93%,P<0.001,提示研究间存在非阈值效应导致的异质性。合并效应量结果显示(图4B)post-ADC诊断完全缓解的SEN合并、SPE合并、PLR合并、NLR合并和DOR合并分别为0.82(95% CI:0.72~0.88)、0.77(95% CI:0.71~0.82)、3.5(95% CI:2.8~4.5)、0.24(95% CI:0.16~0.37)、14.59(95% CI:8.25~25.80)。绘制Deek's漏斗图(图5B)提示不存在发表偏倚(P=0.13)。绘制HSROC 曲线(图6),得出AUC=0.86(95% CI:0.82~0.88)。
有18篇文献研究了ΔADC的诊断价值,Spearman相关系数为0.411,P=0.090,故不存在阈值效应;Meta分析I2=85%,P=0.001,考虑研究间存在非阈值效应的异质性。合并效应量(图4C)结果显示ΔADC诊断完全缓解的SEN合并、SPE合并、PLR合并、NLR合并和DOR合并分别为0.83(95% CI:0.77~0.87)、0.75(95% CI:0.67~0.81)、3.3(95% CI:2.5~4.3)、0.23(95% CI:0.17~0.30)、14.37(95% CI:9.32~22.15)。绘制Deek's漏斗图(图5C)显示倾斜系数P=0.05,提示存在发表偏倚的可能性小。绘制HSROC 曲线(图6),得出AUC=0.86(95% CI:0.83~0.89)。
根据纳入文献的研究类型、磁场强度类型、再评估MRI与新辅助治疗时间间隔、再评估MRI与手术时间间隔、病理结果的盲法对纳入文献进行Meta回归分析,发现再评估MRI与手术时间间隔可能造成治疗后ADC研究间的异质性(P<0.05),其他变量P值均大于0.05,不考虑为研究间异质性来源。
本研究使用Meta分析的方法,系统评价了ADC对LARC新辅助治疗后完全缓解的诊断价值。首先对pre-ADC值、post-ADC值及ΔADC值定量分析的研究进行Meta分析,得出完全缓解组的pre-ADC平均值显著低于非完全缓解组(-0.06×10-3 mm2/s),post-ADC及ΔADC高于非完全缓解组(差值分别为0.17×10-3 mm2/s、28.62%)。然后对诊断价值进行了Meta分析,得出新辅助治疗前ADC值的诊断价值最低,治疗后ADC值及ΔADC的诊断价值相当,三者的AUC分别是:pre-ADC为0.77、post-ADC为0.86、ΔADC为0.86。
DWI通过细胞内外水分子的随机布朗运动反映组织内部的微环境。水分子在生物组织中的扩散速率取决于多种因素,包括组织温度、组织细胞密度、细胞外组织情况、细胞膜的完整性和液体的黏度[58]。研究显示使用DWI评估LARC nCRT后是否达完全缓解的准确性优于常规MRI[59, 60]。ADC是评估水分子在组织内扩散的定量参数,ADC值与组织细胞密度呈负相关[22],肿瘤细胞限制水分子的扩散,随着肿瘤生长,肿瘤细胞密度增大,并且细胞外组织结构被破坏,导致ADC值下降[61]。本研究对新辅助治疗前后ADC及ΔADC的定量分析研究进行Meta分析,结果显示完全缓解组的pre-ADC平均值明显低于非完全缓解组(差值为-0.06×10-3 mm2/s),这与许多研究的结果一致[22,32,34],考虑可能是因为在非完全缓解组中存在较多肿瘤坏死组织。组织坏死导致组织灌注差,氧气浓度低以及组织微环境呈酸中毒,从而使肿瘤抵抗放化疗,导致新辅助治疗效果差[62],因此在新辅助治疗前进行MRI检查并测定肿瘤的ADC值有助于明确肿瘤特征,预测肿瘤对新辅助治疗的反应,从而确定初始治疗方案,尽早予以个体化治疗。另外,本研究结果显示完全缓解组的post-ADC平均值及ΔADC显著高于非完全缓解组,可见新辅助治疗后完全缓解组的ADC值增加程度大于非完全缓解组,放化疗可诱导肿瘤细胞凋亡和坏死、肿瘤结构完全性丧失,并伴有不同程度的纤维化和炎症;此外血管内皮生长因子大量释放,使血管通透性增加,导致原发病灶局部水肿,因此新辅助治疗后ADC值增加[22,32]。ADC值增加程度越大说明新辅助治疗疗效越好,实现完全缓解的可能性越大。在诊断价值方面,新辅助治疗前ADC值的诊断价值最低,治疗后ADC值及ΔADC的诊断价值相当,三者的AUC分别是:pre-ADC为0.77、post-ADC为0.86、ΔADC为0.86。但是Amodeo等[63]研究表明post-ADC的诊断准确性较ΔADC值低,原因可能是post-ADC不能准确区分残留的肿瘤细胞和治疗后的纤维化。同样,Delli Pizzi等[32]及Chen等[64]研究表明ΔADC相比于pre-ADC、post-ADC可作为诊断完全缓解的可靠指标。ΔADC是根据pre-ADC和post-ADC得出,同时考虑了pre-ADC和post-ADC的变化程度。综上,在临床实践中可使用治疗前ADC值预测肿瘤对新辅助治疗的反应,而在评估新辅助治疗后肿瘤是否达到完全缓解时推荐使用ΔADC。
本研究对可能导致异质性的因素进行Meta回归分析,发现MRI与手术间隔时间可能为研究间异质性来源。新辅助治疗后MRI评价肿瘤反应的最佳时机取决于新辅助治疗后的手术时机,新辅助治疗对肿瘤的杀伤效应随时间推移而增加[20]。Probst等[65]研究表明新辅助治疗结束至手术间隔时间大于8周可提高完全缓解率;而另有研究表明延迟手术并未使患者获益[66, 67, 68, 69]。目前国内指南推荐新辅助治疗结束5~7周后行手术治疗[70],但关于最佳MRI检查时机仍缺乏共识,有待进一步研究。
本研究对ADC诊断LARC新辅助治疗后完全缓解的相关文献进行了全面检索,纳入文献较全面,纳入研究对象均为LARC并行nCRT的患者,本文首先排除研究间的阈值效应,然后计算合并诊断指标,研究结果更加可靠。但本研究存在以下局限性:(1)本文纳入的少数研究质量不高,这可能影响整体研究结论的可靠性;(2)本文从研究类型、磁场强度、不同间隔时间以及结果盲法方面进行了研究间异质性分析,但是尚有其他一些因素也可导致研究间异质性,如检查前是否进行肠道准备、MRI扫描层厚、检查结果判读者的经验差异等。
综上所述,本研究得出新辅助治疗前ADC值有助于预测肿瘤治疗反应,而新辅助治疗后ADC值及治疗前后ADC变化率的诊断准确性更高。
全体作者均声明无利益冲突。





















