
人工智能越来越多地应用于图像后处理、疾病诊断与预后评估。最近,以ChatGPT为代表的大型语言模型在自然语言处理领域取得了重大进展,这引起了人们对其在医疗环境中应用的兴趣和担忧。本文从医学影像学的视角讨论如何在医疗环境中利用大型语言模型,以及它们在提高影像学实践、研究和教学工作的效率及有效性方面的潜力。同时,将聚焦大型语言模型在未来实际应用过程中的一些局限性。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
人工智能(artificial intelligence,AI)在医学领域的应用已经取得了很大的发展[1]。医学影像学作为基于数字医学图像的学科专业,是当今AI产品研发及应用最多的领域之一[2]。在医学影像学领域的临床实践中,其常基于医学图像数据进行病灶检测,从而辅助医师实现快速准确的疾病诊断[3]。自然语言处理作为AI领域的另一大分支,与之相关的技术也在快速进展中,但目前在影像学领域中的应用相对尚少[4]。最近,基于大型语言模型(large language model,LLM)的人机交互智能工具,即聊天生成预训练转换器(chat generative pre-trained transformer,ChatGPT)展示出强大的自然语言理解和处理能力,一经推出就获得国际社会的广泛关注。ChatGPT的影响力源于其对话互动性和在包括医学在内的各个领域的认知任务中接近或等于人类水平的表现[5]。其他LLM,如谷歌的Bard、百度的文心一言(Ernie bot)、华为的盘古大模型(PanGu)等,也在信息搜索、内容生成等领域表现出相似的特征。这些LLM在自然语言处理领域取得了极大的进展,在识别、解释和生成文本的过程中,只需极少或无需特定的微调,即“few-shot”或者“zero-shot”[6, 7]。随着深度学习技术、计算资源和用于训练的大型数据集的发展,将为包括医学在内的各领域带来一系列新的机遇和挑战。笔者基于医学影像学的视角,探讨并展望在不同场景中使用ChatGPT等LLM的潜力及可行性,并对其在应用过程中的技术限制和实施障碍进行讨论。





















