述评
应用结构化报告推动医学影像学精准化
中国研究型医院, 2020,07(6) : 4-7. DOI: 10.19450/j.cnki.jcrh.2020.06.002
摘要

通过对医学影像结构化诊断报告的特点、发展历史、主要技术手段及应用方法的归纳总结,阐明结构化报告对于推动医学影像学精准化的作用,以及面临的主要问题和发展方向。面临我国海量的影像数据,亟待研究符合中文影像诊断报告逻辑习惯的结构化报告系统,以构建符合我国医疗行业需求的医学影像数据集。

引用本文: 张翼, 王光彬, 王卫鹏. 应用结构化报告推动医学影像学精准化 [J] . 中国研究型医院, 2020, 07(6) : 4-7. DOI: 10.19450/j.cnki.jcrh.2020.06.002.
参考文献导出:   Endnote    NoteExpress    RefWorks    NoteFirst    医学文献王
扫  描  看  全  文

正文
作者信息
基金 0  关键词  0
English Abstract
评论
阅读 0  评论  0
相关资源
引用 | 论文 | 视频

本刊刊出的文章除特别声明外,不代表主办单位和本刊编委会的观点。本刊如有印刷质量问题,请与本刊编辑部联系调换。

随着医疗领域进入了"大数据时代",伴随而来的有两个课题。一是如何利用数据创新探索医学科学,在庞大的数据资源中快速获取信息以提升医疗水平;再就是,随着"规范-精准医疗"理念的推行,个性化的治疗也要求对疾病表现进行规范及全面的评估。

众所周知,医学影像作为疾病征象的最大信息来源,占全部临床医学信息数据量的80%以上,是疾病的最大信息来源。随着医疗进入大数据时代,医学影像的非结构化属性无法满足大数据分析对数据质量的要求,而传统"随机分析"或"抽样调查"的知识获取方法也不能有效利用全部数据资源。目前,尚需要一种能通过标准化流程和工具对医学影像信息进行结构化转换,建立影像循证知识库的方法,落地医学影像诊断指南,对医学研究提供精准的影像数据支持。

1 医学影像报告的特点

医学影像诊断报告用于表达疾病影像表现的内在信息。相对于影像设备和成像技术的飞跃发展,诊断报告的书写模式并没有太多的改进,尤其是报告中的影像表现和诊断结论,依旧采用描述性语言,依赖于医生的主观判断和经验。尽管业内对报告的书写有一定的规范要求,但不同的医生在分析同一病例的时候仍然会采用不同的描述习惯和术语。一项评估研究[1]分析了297所医院822例患者影像报告,发现14种术语用于描述"浸润"征象,23种术语用于描述"异常",30种术语用于表达"不确定"。这就给后续的数据归档和检索带来很大困难。从信息技术角度看,这种报告属于非结构化数据,计算机只能以自由文本的形式对影像表现和诊断结论进行存储,导致在信息检索时只能通过关键词组合的方式,如"脑+梗死"。这实质上是通过医生输入一系列描述图像相关信息的关键词,然后利用这些关键词为图像建立索引,把对病证的检索变成了文本的检索。由于这种方式的主观性,导致查全率、查准度较低,检索返回无关信息过多、词义间的上下位关系、整体局部关系无法体现等缺点。从影像检查角度看,存在诊断、随访、术前术后评估等多种目的,临床科室对影像报告的关注点也不仅限于诊断结论,而是越来越注重疾病表现的表达及其相关的继发表现,这就要求影像报告所反映的内容更加充实和客观。因此,无论是从大数据的构建,还是个体化的诊疗,都需要对目前影像报告的形式和内容进行改进。基于标准化扫描检查、规范化处理的结构化医学影像报告(structured report,SR)[2]应运而生。

2 结构化报告的实现

如前所述,基于诊断报告进行知识抽取、影像标注的核心问题是将非结构化的影像报告转换为结构化数据。

2.1 标准术语集的建立

对于结构化报告使用医学术语集,北美放射学会(RSNA)在SNOMED CT、LOINC和UMLS的基础上编制了本体(ontology)结构的放射学术语集RadLex[3,4],旨在统一医学影像和放射医学术语的应用,促进医学影像信息的共享。其收录了近5万条医学影像术语,包含解剖学实体、临床发现、图像的获取与展示、影像形态、放射报告组成、属性等几类术语,可以对医疗影像术语和概念间的关系进行可视化展示。RadLex提供了能够描述医学影像学全部信息的标准术语,为结构化报告提供了标准字典库,也为医学影像学信息资源开发利用提供了标准的检索语言[5]。在中文报告的应用中,可以将RadLex术语集翻译成中文,保持了原有RadLex系统结构和编码,为结构化报告模板的制作提供了术语来源。而通过对大量影像报告进行语义分析,通过词向量计算等方法提取报告中的关键词,也可以对已有的术语集进行快速的扩展[6,7]

2.2 依据处理规则及诊断指南的前结构化

将报告模板事先根据疾病类型或检查部位,应用结构化模板进行事先定义。在报告书写过程中,根据疾病的对应项,由诊断医生填入相应位置。结构化报告的概念最早出现于DICOM 3.0标准中,即DICOM SR。其推出的目的在于提升医疗文档中的数值记录功能。它既支持自由文档报告,又支持结构化信息,还具备将文本和数据与病证表达的关键图像进行关联,形成图文形式的报告,消除了图像与数据分离的弊端。利用DICOM SR可以生成具有高度规范性与标准型的图文并茂的检查报告,并为与其它信息系统交互信息提供规范[8]

RSNA在RadLex术语集的基础上按解剖系统分类设计了268个结构化报告模板[9],其中还包括部分中文版本。用户可以参照建立自己的结构化报告系统。"Smart reporting"也是一款基于该思路创建的前结构化报告系统[9],通过对影像诊断指南的分解,建立了相应的结构化模板。用户可以在线填写,并将报告内容复制到RIS系统中。

在中文RadLex词条基础上,可建立不同检查模态、扫描部位以及疾病表现的结构化描述语句。按照检查类型和目的,设计如MRI胎儿神经发育评估,直肠肿瘤的MRI评估,前列腺肿瘤MRI评估,肺结节CT评估,经导管主动脉瓣置入术(TAVI)术前CT评估等结构化模板应用于日常影像检查。此类报告具备的特征为:

(1)采用结构化数据方式呈现。报告模板按照病种不同,以诊断指南或专家共识为标准逐一定制,在内容上要求完全覆盖标准要求,避免书写随意性造成的内容遗漏或省略。涉及影像描述及诊断结果的术语应用标准数据字典编码方式存储,以实现诊断报告的规范化及结构化。

(2)报告中包括表达疾病的关键影像,以图文并茂的形式展现。在报告书写过程中,需要采用图像后处理技术挑选或处理出对疾病诊断具有帮助的关键影像。通过后处理系统与报告模板的结构化消息传递,实现图像阅片、处理、图像标注与数据集构建为一体的流程。

(3)报告包含定量的数值表达与定性的循证结果。医学影像图文诊断及评估报告的书写流程与表现形式与传统影像报告有显著的不同,除了传统报告要求的内容外,还应包含对疾病诊断、随访、评估有重要价值的测量值、图表、关键影像及特征描述。

从应用效果看,前结构化报告有助于提升影像描述的全面性[10,11,12]。前结构化报告的应用前提是在形成特定疾病影像诊断共识的基础上,对影像表现进行分解表述。报告过程要符合影像诊断的实际流程,重点在于研究阅片处理与报告的信息连接,实现结果和效率的并重。

2.3 基于自然语义分析的后结构化

在不改变现有影像诊断报告书写方式的前提下,利用机器学习方法通过对叙述文本的语义分析,获得与影像表达特征相关标签[13]。相对前结构化,该方案不改变原有报告书写习惯,接受程度更高,适用范围较广。但标注准确度还不令人满意,尤其缺乏中文诊断报告的相关研究。该方案的核心就是解决在特定语言环境和表述规范下语义信息提取及分类模型的构建优化及问题,使获得的语义特征尽可能符合报告所描述的影像特征和诊断结论,属于自然语言处理(NLP)方面的研究。

美国NIH于2017年发布了包含30 805例患者胸部X射线数据集,标签是通过NLP技术从相关的诊断报告中自动提取,共有14种胸部病变的标签,预计准确度在90%。在自然语言的数学表达上,研究多使用文本向量(word 2 vector)中Skip-Gram建模,将词汇转换为向量。利用疾病本体知识构建二元语法语言模型(bigrams),进行影像与"诊断结论"之间的关系挖掘匹配[14]。后结构化技术还用于影像数据集的建设。Wang等[15]提出应用后结构方法建设大规模多标签胸部X线影像数据集,以解决医疗影像领域缺乏已标注数据库的难题。

后结构的方法一般包括数据获取,文本预处理,关系抽取,数据标注,知识表示,性能评估等步骤。由于表达方式的自由性和诊断思维的多样性,影像报告目前缺乏统一的结构框架,表现出语法结构不完整、包含大量医疗行业习惯用语以及语义模糊等特征,增加了数据处理与分析的复杂性。Jungmann等[5]应用以RadLex为标签词汇的NLP技术,建立了一种综合前、后结构化优点的影像报告系统。在书写自由文本的过程中,系统自动给出建议的RadLex标注术语,用户可以认可或拒绝,从而实现了报告即标注的流程。

上述列举的研究多集中于以英语为代表的印欧语系为研究对象。众所周知,中文与英文的构词方法和句法存在很大的区别。以英语为代表的印欧语系都实行分词连写,词与词之间用空格分割,一个词汇表达的意思相对固定,因此没有分词问题。印欧语种大多都通过形态变化构造语法结构,有很强的规范性。中文文本则是由连续的字序列构成,词与词之间没有分隔符,需要首先进行分词处理。再者,从影像诊断报告,标注更依赖于文本语句和段落的描述,而非仅仅几个关键词。因此,需要寻找符合中文诊断报告表达的语义模型。上述一系列的问题导致国外研究结果无法直接应用到中文报告的信息处理上。

综上所述,从诊断规范与指南落地的角度看,前结构化通过事先将报告书写内容与格式模板的设定,有助于将指南分解落地;而后结构化方式不改变医生书写习惯,可能会带来更高的效率。

面临我国海量的影像检查数据,亟待研究符合中文影像诊断报告逻辑习惯的结构化报告系统,以构建符合我国医疗行业需求的医学影像数据集。

参考文献
[1]
SchwartzLH, PanicekDM, BerkAR, et al. Improving communication of diagnostic radiology findings through structured reporting[J]. Radiology2011, 260(1):174-181.
[2]
KahnCE, LanglotzCP, BurnsideES, et al. Toward best practices in radiology reporting[J]. Radiology2009, 252(3):852-856.
[3]
LanglotzCP. RadLex: a new method for indexing online educational materials[J]. Radiographics2006, 26(6):1595-1597.
[4]
BudovecJJ, LamCA, KahnCE. Informatics in radiology: radiology gamuts ontology: differential diagnosis for the Semantic Web[J]. Radiographics2014, 34(1):254-264.
[5]
JungmannF, ArnholdG, KampgenB, et al. A hybrid reporting platform for extended radlex coding combining structured reporting templates and natural language processing[J]. J Digit Imaging, 2020, 33(4):1026-1033.
[6]
PerchaB, ZhangY, BozkurtS, et al. Expanding a radiology lexicon using contextual patterns in radiology reports[J]. J Am Med Inform Assoc, 2018, 25(6):679-685.
[7]
BuluH, SippoDA, LeeJM, et al. Proposing new radLex terms by analyzing free-text mammography reports[J]. J Digit Imaging, 2018, 31(5):596-603.
[8]
柳怡韩士忠张鑫.基于辐射剂量结构化报告的未成年人胸部CT检查体型特异性剂量分析[J].中华放射医学与防护杂志, 2020, 40(9): 707-711.
[9]
HongY, KahnCE. Content analysis of reporting templates and free-text radiology reports[J]. J Digit Imaging, 2013, 26(5):843-849.
[10]
LinE, PowellDK, KagetsuNJ. Efficacy of a checklist-style structured radiology reporting template in reducing resident misses on cervical spine computed tomography examinations[J]. J Digit Imaging, 2014, 27(5):588-593.
[11]
曹敏郭小超张来运.医学影像结构式报告的现状和展望[J].放射学实践, 2016, 31(12):1130-1132.
[12]
赵斌.应用结构化报告构建医学影像学大数据[J].医学影像学杂志, 2016, 26(3):377-379.
[13]
胡佳慧赵琬清方安基于医疗大数据的临床文本处理与知识发现方法研究[J].中国数字医学, 2020(7):11-13.
[14]
ShinHC, LuL, KimL, et al. Interleaved text/image deep mining on a large-scale radiology database[J]. J Mach Learn Res, 2016, 17(1): 3729-3759.
[15]
WangX , PengY , LuL , et al. Chest X-ray8: hospital-scale chest X-ray database and benchmarks on weakly-supervised classification and localization of common thorax diseases[C]// Computer Vision & Pattern Recognition. Honolulu, USA: IEEE, 2017: 3462-3471.
 
 
展开/关闭提纲
查看图表详情
回到顶部
放大字体
缩小字体
标签
关键词