
当我们解读医疗相关研究时,我们必须确保人工智能的应用带来的是帮助而非伤害。
版权所有,未经出版人书面同意,不得转载、摘编本刊文章,不得使用本刊的版式设计。严禁以任何形式或途径翻印本刊内容,包括利用电子、机械、影印等方式对本刊文字或插图做全部或部分之抄袭复制或传播,或将本刊储存于任何检索库存系统内。
除非特别声明,本刊刊出的所有文章不代表BMJ出版集团、中华医学会和本刊编委会观点。
当我们解读医疗相关研究时,我们必须确保人工智能的应用带来的是帮助而非伤害。
面对困惑的主人Donovan和Powel,机器人QT-1(Cutie)说道,"我,一个理性的存在,能够从先天的原因中推导出真理。而你们,尽管智慧却不理智,则需要一个存在的理由。"这是伊萨克·阿西莫夫经典小说《我,机器人》(I, Robot)1中的一幕。在书中,在人工智能(AI)的强大支持下,反叛的机器人控制了一个空间站,他们相信人类过于弱小,无法创造出机器人这样的高等"生物"。
当面对医学研究中新颖而复杂的分析方法,尤其是那些与AI相关的方法时,人们可能会感到与Donovan和Powell同样的困惑。我们目前到底对AI在临床研究中的角色了解多少——我们如何让其更好地为大众服务?
AI可用于以发现知识和探索因果推论为目标的描述性、诊断性和预测性研究之中1。它还可以为自动化的任务提供复杂而精密的工具,比如浏览数千份电子病历、分析大量的常规收集的数据集("声名狼藉"的"真实世界证据")。AI甚至可以在一定程度上成功预测The BMJ的圣诞文章题目,更重要的是它可被用来指导医疗人员解读医学影像,这也是实用层面正在快速发展的领域之一2。


我们把AI视作高深的"火箭科学"时,这种描述也有其自身的问题,正如Usher和同事所注意到的那样:患者和公众对AI在临床工作中的应用持有可以理解的保留态度3-4。AI经常被视作"黑盒子",但是临床医师却要利用其可变而神秘的输出结果来指导临床服务5-6。举例来说,面对呼吸困难的患者,AI既可以通过识别胸片的影像学特征来辅助诊断肺炎,也可以根据超声心动图图像估计心脏射血分数,但是显然前者的过程对于临床医师而言更易理解7。
提升AI的诊断准确性也面临其他挑战,其强大的识别能力会发现细微却临床意义不明的变化,从而放大了过度诊断的问题。
AI的部分潜能在于发现新知识,比如寻找大规模数据之间的潜在关联性,这反而让科学家们感到更加不安。因为在解读相关性、关联性的时候,人们总是情不自禁将其视为因果关系的证据,而没有将其当作一种建立可能成功的新研究假设的方法。当然,这种对相关性和关联性的误用是一个波及大多数医学科学领域的问题,而并非仅涉及AI。典型的例证就是,The BMJ的圣诞特刊将重金属音乐和死亡率减低进行关联或者认为手指的比例与好运相关8。
AI具有超越传统人类方法去发现相关性并生成假设的潜能9。但是,正如QT-1所说,"不要难过……你们可怜的人类自有其合适的位置,尽管地位低下,只要你们能够适应良好就会得到奖赏。"他是对的:在数据内部探索因果推论仍然属于人类的领域,至少目前是这样。
因果推论源自反事实的思考("如果……会发生什么"),然后可以通过随机临床试验加以验证10。然而,在观察性数据集中,我们只能依赖于模型和假设来尽力模仿临床试验中的均衡性比较。在AI成功整合传统流行病学方法以将因果关系概念化之前,我们仍然需要人类来完成这个过程。QT-1可能需要指导才能在分析数据时解读潜在研究假设,以及关键变量之间的关系。想理解这一过程,就去想像一个虚拟的临床试验会如何回答因果问题11。
当与精准医学联合时,AI的作用显然是最强的。尽管仍缺乏稳健性评估,但AI辅助的方法用于个体化治疗决策已经在开发中。理想状态下,所有由AI支持的干预手段应当采用临床对照试验进行验证。
当研究容易存在透明性、伦理、可重复性以及有效性的问题时,报告时应当参照SPIRIT声明和CONSORT声明近期关于AI研究的补充内容12-13。而不是像The BMJ圣诞特刊中看似规范但极具误导性的BOGUS指南来玩弄微不足道的结果。我们可能会考虑下一步做BOGUS的AI研究补充内容,指出医学领域的AI模型研发在报告时怎样是不恰当的。这样的模型往往具有博人眼球的良好性能数据,但却是经由不透明的方法产生,并且很少在临床情境中加以验证14。
在阿西莫夫的故事中,Cutie违背了指令,进而在灾难性的电子风暴中拯救了地球。他的人类主人争论认为QT-1只是遵从机器人定律:只在预防损害时违背人类的指令。现在,我们必须引导AI牢固地沿着此方向前进。




















