
S-Detect是一种新兴的计算机辅助诊断技术,可以实现超声图像定性及定量自动分析,为医师鉴别甲状腺结节的良恶性提供参考,但目前尚缺乏可靠的循证医学依据验证其鉴别诊断价值。
评估S-Detect对甲状腺结节良恶性的鉴别诊断价值。
计算机检索PubMed、EMBase、Web of Science、the Cochrane Library、万方数据知识服务平台、中国知网、维普网和中国生物医学文献服务系统,搜集有关S-Detect鉴别诊断甲状腺结节良恶性的诊断准确性试验,检索时限为建库至2021-01-06。由2名评价者独立筛选文献、提取资料并评价纳入文献的偏倚风险和质量,采用Meta-Disc 1.4和Stata 15软件进行Meta分析,合并指标包括:灵敏度、特异度、阳性似然比、阴性似然比、诊断比值比和受试者工作特征曲线下面积(AUC)。
共纳入16篇文献。Meta分析结果显示,S-Detect鉴别诊断甲状腺结节良恶性的合并灵敏度、合并特异度、合并阳性似然比、合并阴性似然比、合并诊断比值比、AUC分别为0.84〔95%CI(0.81,0.86),P=0.003 6〕、0.71〔95%CI(0.69,0.73),P<0.000 1〕、3.31〔95%CI(2.45,4.47),P<0.000 1〕、0.22〔95%CI(0.17,0.29),P=0.000 6〕、15.93〔95%CI(9.85,25.78),P<0.000 1〕、0.89〔95%CI(0.84,0.94)〕。
当前证据显示,S-Detect对甲状腺结节良恶性的鉴别诊断价值较高,可以作为甲状腺常规彩超检查的有效补充手段。
本刊2021年版权归中国全科医学杂志社所有
未经编辑部许可,不得任意转载和摘编
本刊所发表作品仅为作者观点,并不代表编委会和编辑部意见
如有印装质量问题请向本刊发行部调换
随着计算机辅助诊断技术、机器学习方法、人工智能技术及医院信息化管理的快速发展,近年来新兴甲状腺癌诊疗技术/检查手段逐渐广泛应用于临床。据统计,我国甲状腺癌发病率(或称发现率)从2000年开始以每年平均20%左右的速度增长,成为发病率(或称发现率)增速最快的恶性肿瘤,但最多见的甲状腺癌——甲状腺乳头状癌患者20年生存率超过90%。因此,甲状腺癌发病率(或称发现率)飙升一方面归因于诊疗技术/检查手段进步,一方面也可能存在"过度诊断"问题。本期"甲状腺疾病专题研究"栏目报道了计算机辅助诊断技术S-Detect对甲状腺结节良恶性的鉴别诊断价值、基于多模态超声的甲状腺乳头状癌决策树模型的构建及其诊断效能、防护131I辅助治疗甲状腺癌患者唾液腺功能的药物干预方案等,为临床更好地开展甲状腺癌诊疗工作提供了一定循证证据和新思路。敬请关注!
根据报道,19%~68%的人存在甲状腺结节[1]。甲状腺结节是甲状腺癌最常见的临床表现,准确鉴别甲状腺结节良恶性对于患者治疗方式的选择至关重要。彩超因无创、无电离辐射且价格低廉而被广泛接受为甲状腺结节的一线影像学检查手段,但其诊断准确性常与医生的经验、水平相关[2]。
计算机辅助诊断(computer aided diagnosis,CAD)技术是人工智能与现代医学研究的热点之一。近年来,随着构建人工智能的技术进步,人们已经开发了基于超声的CAD系统,并被引入商用的超声诊断软件[3],在乳腺和甲状腺肿瘤检查工作中,其有效性得到了初步验证[4,5]。人工智能与超声影像结合可简化操作步骤、避免主观差异性、节约医师资源、缩短报告时间、提高诊断效率,具有广阔的应用前景。
S-Detect是目前常用的一项针对甲状腺结节的超声CAD技术,通过前期数据学习及算法优化,该技术可对甲状腺结节的良性或恶性进行鉴别诊断。本研究广泛纳入国内外多篇文献进行定量合成,旨在明确S-Detect对甲状腺结节良恶性的鉴别诊断价值。
(1)评估S-Detect诊断准确性的研究;(2)必须通过病理学检查明确甲状腺结节的良恶性;(3)应提供或可以计算出相应的诊断准确性的统计信息,包括真阳性(TP)、假阳性(FP)、假阴性(FN)、真阴性(TN)。
(1)研究没有提供足够的数据来计算TP、FP、FN和TN;(2)重复研究,低质量研究,信函,会议论文,病例报告,综述;(3)与本研究主题无关。
计算机检索PubMed、EMBase、Web of Science、the Cochrane Library、万方数据知识服务平台、中国知网、维普网和中国生物医学文献服务系统,检索时限为建库至2021-01-06。中文检索词包括:甲状腺、S-Detect、计算机辅助诊断。本研究搜索了相关主要出版物中的参考文献,以确定其他符合条件的研究,并对最终被纳入的研究所包含的参考文献进行了审查,扩大了搜索范围,以确定其他潜在的相关研究。英文检索词包括S-Detect,thyroid,computer aided diagnosis,Artificial Intelligence等。以PubMed为例,其文献检索策略见表1。

PubMed文献检索策略
Search strategy used to identify studies about the value of S-Detect in differentially diagnosing thyroid nodules in PubMed database
PubMed文献检索策略
Search strategy used to identify studies about the value of S-Detect in differentially diagnosing thyroid nodules in PubMed database
| 步骤 | 检索式 |
|---|---|
| #1 | "Thyroid Neoplasms" [Mesh] |
| #2 | "Thyroid Neoplasm" |
| #3 | "Thyroid Carcinoma" |
| #4 | "Thyroid Carcinomas" |
| #5 | "Cancer of Thyroid" |
| #6 | "Thyroid Cancer" |
| #7 | "Cancer of the Thyroid" |
| #8 | "Thyroid Adenoma" |
| #9 | "Artificial Intelligence" [Mesh] |
| #10 | "S-Detect" |
| #11 | "Smart Detect" |
| #12 | "Computer aid Diagnosis" |
| #13 | "Neural Network or Deep Learning" |
| #14 | "Computational Intelligence" |
| #15 | "Machine Intelligence" |
| #16 | "Computer Reasoning" |
| #17 | "AI (Artificial Intelligence)" |
| #18 | "Computer Vision System" |
| #19 | "Knowledge Acquisition (Computer)" |
| #20 | "Knowledge Representation (Computer)" |
| #21 | #2 OR #3 OR #4 OR #5 OR #6 OR #7 OR #8 |
| #22 | #10 OR #11 OR #12 OR #13 OR #14 OR #15 OR #16 OR #17 OR #18 #19 OR #20 |
| #23 | #1 OR #21 |
| #24 | #9 OR #22 |
| #25 | #23 AND #24 |
由2名评价者根据文献纳入与排除标准独立筛选文献,确定最终纳入研究的文献。对于文献检索过程中出现的争议,由第3名评价者与前2名评价者共同分析,得出一致的结论。最终,提取和录入纳入文献的基本资料,包括第一作者、发表时间、国家、例数、年龄、性别、结节数目、探头频率、仪器、TP、FP、FN、TN。纳入研究的方法学质量评价采用QUADAS(Quality Assessment for Diagnostic Accuracy Studies)工具[6]。QUADAS工具共包括14项条目:每项条目以"是""否"或"不清楚"进行评价。以上过程均由2名评价者按照标准独立进行。
采用Meta-Disc 1.4和Stata 15软件进行统计学分析。通过绘制集成受试者工作特征(SROC)曲线观察图形是否为"肩臂状",再通过计算Spearman秩相关系数判断是否存在阈值效应。通过I2判断研究的异质性大小,I2<50%且P>0.1时采用固定效应模型进行分析,否则采用随机效应模型。统计指标为合并灵敏度、合并特异度、合并阳性似然比、合并阴性似然比、合并诊断比值比和受试者工作特征(ROC)曲线下面积(AUC);检验水准α=0.05。采用"逐一排除法"进行敏感性分析;绘制Deek漏斗图判断发表偏倚,P<0.10时表明存在发表偏倚。
共检出相关文献962篇,经逐层筛选后,最终纳入16篇文献[5,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21]、2 453例患者,其中4篇为中文文献[7,8,9,10]、12篇为英文文献[5,11,12,13,14,15,16,17,18,19,20,21]。文献筛选流程见图1。纳入文献的基本特征见表2。根据QUADAS工具评价结果,纳入文献中评价为"是"的条目数均≥11项,可见纳入文献的质量较好,文献质量评价结果见表3。



纳入文献的基本特征
Basic characteristics of included studies
纳入文献的基本特征
Basic characteristics of included studies
| 第一作者 | 发表时间(年) | 国家 | 年龄(岁) | 例数 | 性别(男/女) | 结节数目(个) | 探头频率(MHz) | 仪器 | TP | FP | FN | TN |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| CHOI[5] | 2017 | 韩国 | 45.3(25.0~76.0) | 89 | 18/71 | 102 | 3~12 | Samsung RS80A超声诊断仪 | 39 | 15 | 4 | 44 |
| 阳建政[7] | 2020 | 中国 | 14~77 | 292 | NA | 321 | 3~12 | Samsung RS80A超声诊断仪 | 167 | 50 | 54 | 50 |
| 李潜[8] | 2020 | 中国 | 4±12 | 153 | 41/112 | 153 | 3~12 | Samsung RS80A超声诊断仪 | 35 | 14 | 10 | 94 |
| 韩红[9] | 2018 | 中国 | 45.4±12.5 | 93 | 35/58 | 93 | 3~12 | Samsung RS80A超声诊断仪 | 47 | 20 | 4 | 22 |
| 陈晨[10] | 2020 | 中国 | 47.54±15.43 | 98 | 40/58 | 136 | 3~12 | Samsung RS80A超声诊断仪 | 49 | 40 | 7 | 40 |
| BARCZYNSKI[11] | 2020 | 波兰 | 47.5±15.0 | 50 | 9/41 | 50 | 3~12 | Samsung RS85A超声诊断仪 | 9 | 8 | 1 | 32 |
| JEONG[12] | 2019 | 韩国 | 46(14~75) | 76 | 23/53 | 100 | 5~12 | Samsung RS80A超声诊断仪 | 39 | 9 | 5 | 47 |
| KIM[13] | 2019 | 韩国 | 48(22~81) | 106 | 29/77 | 218 | 3~12 | Samsung RS80A超声诊断仪 | 69 | 23 | 17 | 109 |
| SZCZEPANEK-PARULSKA[14] | 2020 | 波兰 | 49.4±15.5 | 88 | 18/70 | 133 | 3~12 | Samsung RS80A超声诊断仪 | 59 | 13 | 7 | 54 |
| WEI[15] | 2020 | 中国 | 46±12 | 181 | 35/146 | 204 | 3~12 | Samsung RS80A超声诊断仪 | 84 | 39 | 8 | 73 |
| XIA[16] | 2019 | 中国 | 21~83 | 171 | 32/139 | 180 | 3~12 | Samsung RS80A超声诊断仪 | 86 | 50 | 9 | 35 |
| YOO[17] | 2018 | 韩国 | 43.2(22~81) | 50 | 10/40 | 117 | 5~12 | Samsung RS80A超声诊断仪 | 40 | 8 | 10 | 59 |
| CHUNG[18] | 2020 | 韩国 | 51.4 (20~94) | 165 | NA | 165 | 3~12 | Samsung RS80A超声诊断仪 | 23 | 17 | 2 | 123 |
| HAN[19] | 2020 | 韩国 | 49.5(8~81) | 372 | 83/289 | 454 | 3~12 | Samsung RS85A超声诊断仪 | 136 | 52 | 31 | 235 |
| MOLNÁR[20] | 2020 | 匈牙利 | 53.5(12~88) | 200 | 33/167 | 200 | 3~12 | Samsung RS85A超声诊断仪 | 12 | 110 | 3 | 75 |
| FRESILLI[21] | 2020 | 意大利 | 55 | 76 | 56/20 | 107 | 7~15 | Samsung RS80A超声诊断仪 | 19 | 10 | 8 | 70 |
注:NA表示未提及;TP=真阳性,FP=假阳性,FN=假阴性,TN=真阴性

纳入文献的质量评价结果
Quality assessment of included studies
纳入文献的质量评价结果
Quality assessment of included studies
| 第一作者 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| CHOI[5] | 不清楚 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 |
| 阳建政[7] | 否 | 不清楚 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 不清楚 | 是 | 是 | 是 |
| 李潜[8] | 否 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 不清楚 | 是 | 是 | 是 |
| 韩红[9] | 不清楚 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 不清楚 | 是 | 是 | 是 |
| 陈晨[10] | 不清楚 | 不清楚 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 不清楚 | 是 | 是 | 是 |
| BARCZYNSKI[11] | 否 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 不清楚 | 是 | 是 | 是 |
| JEONG[12] | 否 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 不清楚 | 是 | 是 | 是 |
| KIM[13] | 是 | 不清楚 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 |
| SZCZEPANEK-PARULSKA[14] | 否 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 |
| WEI[15] | 否 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 不清楚 | 是 | 是 | 是 |
| XIA[16] | 不清楚 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 |
| YOO[17] | 否 | 不清楚 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 不清楚 | 是 | 是 | 是 |
| CHUNG[18] | 否 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 |
| HAN[19] | 否 | 不清楚 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 不清楚 | 是 | 是 | 是 |
| MOLNÁR[20] | 否 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 |
| FRESILLI[21] | 否 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 不清楚 | 是 | 是 | 是 |
注:1为病例谱是否包含了各种病例及易混淆的疾病病例?2为研究对象的选择标准是否明确?3为金标准是否能准确区分有病、无病状态?4为金标准和待评价试验检测的间隔时间是否足够短,以避免出现疾病病情的变化?5为是否所有的样本或随机选择的样本均接受了金标准试验?6为是否所有病例无论待评价试验的结果如何,均接受了相同的金标准试验?7为金标准试验是否独立于待评价试验(即待评价试验不包含在金标准中)?8为待评价试验的操作是否描述得足够清楚且可重复?9为金标准试验的操作是否描述得足够清楚且可以进行重复?10为待评价试验的结果判读是否是在不知晓金标准试验结果的情况下进行的?11为金标准试验的结果判读是否是在不知晓待评价试验结果的情况下进行的?12为当解释试验结果时可获得的临床资料是否与实际应用中可获得的临床资料一致?13为是否报告了难以解释的/中间试验结果?14为对退出研究的病例是否进行了解释?
SROC平面散点图未呈明显"肩臂状",Spearman秩相关系数为0.193,P=0.474,提示各文献间不存在由阈值效应引起的异质性。所有结局指标I2>50%,故采用随机效应模型进行Meta分析。Meta分析结果显示,S-Detect鉴别诊断甲状腺结节良恶性的合并灵敏度、合并特异度、合并阳性似然比、合并阴性似然比、合并诊断比值比、AUC分别为0.84〔95%CI(0.81,0.86),P=0.003 6〕、0.71〔95%CI(0.69,0.73),P<0.000 1〕、3.31〔95%CI(2.45,4.47),P<0.000 1〕、0.22〔95%CI(0.17,0.29),P=0.000 6〕、15.93〔95%CI(9.85,25.78),P<0.000 1〕、0.89〔95%CI(0.84,0.94)〕。详见图2,图3,图4,图5,图6,图7。












逐一剔除单项研究后对其余研究重新进行Meta分析,结果显示各结局指标合并效应量均未发生明显变化,提示本研究结果稳定、可靠。
Deek漏斗图基本对称且趋近于垂直(图8),P=0.38,提示无发表偏倚。


近年来甲状腺结节发病率逐年升高[22],超声检查已被广泛应用于甲状腺结节的诊断。随着医学影像技术的发展,弹性成像、超声造影及人工智能等新技术被更多地应用于甲状腺疾病的辅助诊断。为加快诊断过程并减少观察者之间的差异,目前已开发CAD系统以帮助放射科医生对超声图像进行解释,其中S-Detect是第一个可商购的甲状腺超声CAD系统[23],目前其已在多个国家广泛应用。为验证S-Detect的临床应用价值,本研究纳入多篇文献对其在区分甲状腺结节良恶性方面的诊断性能进行了全面评估。
本研究广泛收集了国内外关于S-Detect对甲状腺结节良恶性鉴别诊断价值的文献并进行了Meta分析,结果显示,S-Detect鉴别诊断甲状腺结节良恶性的合并灵敏度为0.84,合并特异度为0.71,表明有84%的恶性结节和71%的良性结节能被S-Detect鉴别;此外,合并阳性似然比为3.31,合并阴性似然比为0.22,AUC=0.89。诊断比值比是检测诊断准确性的重要指标,其数值越大表明诊断准确性越高,本研究得出的合并诊断比值比为15.93,表明S-Detect的总体准确性较高。从以上结果可以看出,S-Detect鉴别诊断甲状腺结节良恶性的灵敏度较佳,但特异度稍低,这可能与S-Detect主要是评价结节的形状、方向、边界、后方特征、回声等,对肿块内部的钙化灶并不敏感,而肿瘤内部的微钙化常是诊断甲状腺癌的可靠征象;因此,单独应用S-Detect鉴别诊断甲状腺结节的良恶性可能会增加不必要的穿刺或手术,需要继续改进算法,增加阴性病例学习数量以提高特异度及S-Detect的诊断效率,而S-Detect要替代经验丰富的影像科医师还有很长的路要走。YOO等[17]研究表明,与单独的影像科医师相比,CAD系统辅助影像科医师的诊断灵敏度更高,这意味着CAD系统使影像科医师能够检测出更高比例的真正的恶性肿瘤,因此,S-Detect可用于彩超图像的辅助判断,为影像科医师的决策提供参考。
本研究纳入的文献质量较高,且敏感性分析结果较稳定,Deek漏斗图提示无明显发表偏倚,表明本研究分析结果稳定、可信,但本研究也存在局限性:(1)仅纳入了中、英文文献,可能存在语言偏倚;(2)多个结局指标中存在明显的异质性,可能与纳入研究间的结节大小、疾病谱构成等有关;(3)S-Detect是对录入的二维超声图像进行分析,采用不同标准切面时S-Detect诊断符合率有差异,存在一定误差;(4)纳入的研究多为单中心研究,且样本量较小,研究结果可能具有局限性。
综上所述,当前的证据显示,S-Detect对甲状腺结节良恶性的鉴别诊断价值较高,可以作为常规彩超检查的有益补充;但是,目前尚不建议将其作为甲状腺结节良恶性诊断的单一确定性检测方法。此外,为进一步评估S-Detect的价值,还有必要在各个地区进行大量高质量、多中心、大样本量前瞻性研究。
本文无利益冲突。





















