
糖尿病是一种慢性非传染性疾病,目前只能通过长期用药和自我管理来缓解病情,无法根治。临床决策支持系统能够模拟糖尿病医疗专家诊断疾病的思维过程,向医生提供常规诊疗方案,推荐最优方案。现有的临床决策支持系统大多基于临床指南、规则、案例推理以及本体。大数据技术可获取和处理多元异构的各类数据,提供更科学的个性化诊疗方案。近年来已有基于决策树、神经网络、模糊逻辑、支持向量机、APRIORI关联规则与多维分析和时序挖掘等多种大数据处理方法应用于糖尿病的临床诊断,但其尚处于起步阶段。对基于大数据技术的糖尿病临床决策支持系统的框架进行了分析,并展望了未来的诊疗方式。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
糖尿病是目前世界上主要的慢性非传染性疾病之一,随着社会经济的发展与生活方式的改变,即人们摄入过多高热量的食物、体力活动减少而致肥胖,以及环境改变等因素[1]均导致糖尿病患病率日益上升,目前已成为影响人类生活质量的主要疾病[2]。糖尿病患者病情的缓解除了与治疗方案密切相关,在很大程度上也取决于患者的自我管理。大数据技术推动了现有临床决策支持系统的发展,其不仅能帮助医疗工作者对糖尿病的诊断和治疗做出更加精准的决策,而且还能指导患者对自身疾病进行科学的管理[3]。
目前,学术界公认的糖尿病定义是指伴随因胰岛素分泌及/或作用缺陷而导致糖、脂肪和蛋白质代谢紊乱的代谢性疾病,其特点是慢性高血糖。长期的高血糖容易引起患者视网膜、肾脏、神经以及心血管等发生慢性病变[4]。根据致病源将糖尿病可大致分为1型糖尿病、2型糖尿病、妊娠糖尿病及特殊类型糖尿病,我国各种糖尿病类型患病比例如图1所示。正常人的胰腺能够分泌出足够的胰岛素来调节代谢过程,但1型糖尿病患者由于β细胞的损坏,通常胰岛素绝对缺乏,并存在自身免疫性。2型糖尿病患者主要由于胰岛素抵抗伴随相对胰岛素分泌不足[5],或胰岛素分泌正常但其作用受体不敏感。妊娠糖尿病特指女性在怀孕期间发生的糖尿病。


糖化血红蛋白(A1c)(层析法NGSP标准)测定值在4%~6%(或己糖激酶GLU-HK在3.9~6.1 mmol/L)为正常参考范围,糖化血红蛋白>6.5%均可视为糖尿病,其是现有糖尿病临床诊疗的金标准。常用的辅助诊断方案是口服糖耐量实验,即通过3 h内多个时间点测试(0、30、60、120、180 min)得到的葡萄糖浓度(3.9~6.1 mmol/L为正常参考值)及胰岛素值(2.6~24.9 mIU/L为正常参考值),并观察其变化来判断胰岛功能是否受损从而判定疾病的类型[6]。
此外,糖尿病的并发症高达100多种[7],可分为急性和慢性两类。急性并发症表现为应激情况下消化系统、精神以及神经等方面的急性变化;慢性并发症早期无明显症状,表现为糖尿病视网膜病变、糖尿病性肾病、糖尿病神经病变和糖尿病足等长期代谢异常导致的器官损害[8]。
根据国际糖尿病联合会(IDF)发布的最新全球糖尿病概览(Diabetes Atlas)第七版,全世界糖尿病成年患者约为4.15亿例,全球每11名成年人就有1人患有糖尿病。中国是糖尿病的高发区,近几年发病人数增加了19%(图2),20~79岁人群发病率已达10.6%。据统计,糖尿病及其并发症患者的死亡率已大于艾滋病、结核病及疟疾3大传染病死亡率之和,每6秒即有1例患者死亡。


糖尿病的疾病管理[9]包括对受试人群进行分类识别、循证医学的指导、医疗工作者与患者协调运作、患者自我管理教育、治疗过程与结果的预测和管理以及定期的报告和反馈,上述多个方面的统筹目前仍是难以解决的问题。构建疾病管理系统可以在建立详细医疗保健库的基础上,利用循证医学的方法对疾病诊疗提出各种针对性的建议,以经济的方式达到改善目标人群健康的目的[10]。
临床决策支持系统(clinical decision support system, CDSS)是专为医生诊疗工作提供决策支持和帮助的计算机系统。1997年,Musen对临床决策支持系统做了如下定义:任何将临床数据作为输入信息,将推论结果作为输出,有助于临床医生决策并被用户认为具有"智能性"的软件即可称为临床决策支持系统[11]。
世界上第一个功能较全面的CDSS是20世纪70年代斯坦福大学的Shortliffe等研发的MYCIN系统[12],该系统主要用于中枢神经系统感染的诊断和治疗咨询,系统可根据用户所输入的患者临床表现和化验诊断结果判断其感染细菌的种类并给出相关的临床处理建议。MYCIN系统定位于医生顾问,具有一定的解释功能。匹兹堡大学研制的Internist-I[13]与哈佛医学院开发的DXplain[14]等系统可针对多种疾病的多种症状进行辅助诊断。近年来针对单一疾病的专项医学专家系统更是不断涌现,如贫血诊断报告系统[15]、计算机辅助乳腺治疗计划系统[16]。邓艺和彭柳芬[17]针对糖尿病开发了临床用药决策支持系统,该系统以目前糖尿病疾病相关数据为系统数据资源,对糖尿病进行药物的辅助决策,大体上可对糖尿病做出决策支持。
CDSS可有多种构建方法[18],基于临床指南的系统是依据循证医学(EBM)的方法开发的。目前最新的糖尿病临床指南是美国糖尿病学会(ADA)于2016年12月发布的糖尿病诊疗标准。该系统基于规则与案例推理吸收了规则推理方法,具有推理过程严谨且案例推理方法可实时加入大量糖尿病病例的优点;基于本体的系统首先建立糖尿病领域本体即术语体系,在形成先验知识的基础上构建知识库,从而在病例中挖掘信息而辅助诊疗;基于机器学习的系统能够对糖尿病的临床指标、诊断及用药在多个维度上进行分析,并能根据数据挖掘潜在的糖尿病诊疗规则。
CDSS的功能在于能够模拟糖尿病医疗专家诊断疾病的思维过程,向医生提供常规诊疗方案并推荐最优方案,提高对糖尿病患者的治疗及管理效果[19]以降低成本、缩短治疗周期;另一方面,可帮助入门医生顺利开展治疗,降低医疗误诊率,拓展医生的知识宽度,并结合最新的诊断标准帮助医生迅速掌握前沿的诊断更新。
目前,较为流行的基于规则与案例推理的CDSS存在的问题在于规则库的规模扩大会导致推理过程的搜索空间增加和推理效率下降;另外,这种构建方式难以表达深层的领域知识,难以统一案例的索引和标准的匹配,缺乏严密的理论基础等。
近年来,随着医疗大数据技术的不断进步,很多医院已建立了数据中心,其可记录患者就医时全部的相关数据,实现全流程医疗数据医嘱闭环管理,基本做到"流程可追溯,信息可追踪,出错可纠正,效果能统计,结果可分析" 。魏鑫然等[20]提出基于大数据CDSS的功能应包括接受临床事实、再学习、解释、推理决策、治疗安全警示及预测病情进展6大功能模块,并能结合不同患者的历史处方进行用药提示和数据统计分析,表明疾病治疗已迈入精准管理阶段。
糖尿病大数据可由多元异构的各种类型数据构成,并可通过多种方式获取,如疾病相关文献数据、个性化的诊疗数据、电子病例、诊断事件序列、体检报告、个人健康档案、可穿戴设备获取的连续血糖监测数据、连续胰岛监测数据及个体行为数据等;数据整合是其中必不可少的必要环节。目前较为流行的Hadoop平台基本能存储和处理国内粉末化的数据平台所整合的大数据,其本质是一个开源云计算平台,包括文件系统(HDFS)、数据库(HBase、Cassandra)、数据处理(MapReduce)等功能模块[21],可对大数据内容进行定性分析和计算,深度挖掘大数据的价值,并由此构建糖尿病数据仓库,综合疾病治疗标准、历史案例、医学术语模型及数据分析方法以形成临床决策,为医生提供对药物干预方案、运动方案以及推荐合理的饮食方案(图3)。


糖尿病大数据CDSS必须通过机器学习来实现[22],学习方法包括基于决策树、随机森林、神经网络、模糊逻辑、支持向量机及Aprior关联规则等算法。基于决策树的方法用于判断患者所患糖尿病的类型,首先根据是否处于妊娠期来判断是否属妊娠型糖尿病;然后根据自发性酮症、年龄以及起病的快慢和患病的轻重来判断是1型糖尿病还是2型糖尿病[16],从而实现对糖尿病的分类;多层感知神经网络的方法是根据患者的性别、年龄、体质量与空腹血糖判断其精神状态是抑郁、焦虑还是积极的心理状态;利用模糊逻辑的方法,根据患者的禁忌证候来筛选所使用的药物,再结合医生的意见使用神经网络确定最佳的用药方案[23];支持向量机(SVM)将糖尿病特征子集(腰围、腰围/臀围、舒张血压、年龄)作为输入向量,利用最佳特征子集的特征筛选算法实现2型糖尿病判别与风险因素筛选[24];利用Apriori关联规则算法分析美国医疗数据库(Health Facts)中的糖尿病患者的电子病例,再根据患者的各个属性特征辅助医生制定治疗方案[25]。
目前,虽然存在许多糖尿病的辅助决策支持系统,但是真正基于大数据技术的研究尚处于起步阶段[26]。利用大数据技术对电子病历及其他类型疾病的相关数据进行分析和处理,既能让医生的诊疗趋于透明化,有助于发掘有效的临床诊疗路径,又可为医生提供可靠、最优的诊疗建议。这样不仅节约了医院的医疗资源,亦在一定程度上降低了患者的就医成本,从而部分缓解了老百姓就医难、就医贵的现状[27]。
与以往基于if-then式演绎法规则的专家系统不同,IBM's Waston系统的核心过程是基于循证的自动回答[28]。循证问答的原理是类比归纳法,即通过类比大量相似病例首先归纳出对应症状与医生检查的类型,然后类比相似检查结果归纳出与疾病关联密切的检查结果,最后基于相似病例的类比,归纳出对应于糖尿病及其并发症的组合,临床医生通常习惯所开药方等。
另外,有研究人员开发出了PULSE系统(personalized ubiquitous life-care decision support system),该系统将传统的使用医疗逻辑模块且基于临床知识库的方法与大数据模式下的机器学习方法相结合,把与临床相关的电子病例记录、电子健康记录和个人健康档案数据与物联网技术所获取的生理数据相关联,从而分析出空腹血糖变化的原因[29]。
谷歌的一个研究小组利用深度学习来筛查糖尿病性视网膜病变(diabetic retinopathy, DR)[30]。其开发的算法能解释视网膜照片中的DR迹象,可在医疗资源有限的社区医院筛查更多的病例。研究结果表明,算法的实现与眼科医生的诊断结果相当吻合,即在文中描述的特定验证集上算法具有0.95的F-Score(综合灵敏度和特异性的度量,最大值为1),性能略高于其所咨询的8名眼科医生的F-Score中值(0.91)。深度学习是一种包含多隐含层的神经网络结构,可通过逐层预训练来有效降低梯度弥散问题,降低训练难度,提高预测精度。常用的深度网络模型包括卷积神经网络、深度置信网及循环神经网络等。近年来,深度学习在博弈、语音、图像、自然语言理解及医疗诊断等领域取得了一系列重大进展,成为国内外的研究热点。
目前国内已经开展了对糖尿病临床数据的多维分析和时序挖掘研究。多维分析主要采用HANA数据库中数据,最终实现了糖尿病的指标、用药、诊断等主题下的图表展示;时序挖掘主要采用糖尿病的历史临床真实数据进行事件序列化,提出并验证了基于时间窗口的诊断事件序列频繁模式算法[31]。上海市第六人民医院(上海交通大学附属第六人民医院)正在进行糖尿病机器学习决策系统的建设,其将电子健康记录与病例报告表的临床数据相结合,已实现术语及诊断的自动归类。
以往糖尿病决策支持系统大都采用基于单一时间点,即根据患者就诊时的血糖值给出诊断方案,而无法反映患者的病史。近年来,可穿戴监测设备的兴起使得决策系统能连续地监测和管理患者的血糖数据变化,医生可对患者的历史数据进行分析,并给出更符合患者病情的治疗方案。未来的智能检测不仅能实现对数据实时动态的记录,而且还可利用机器学习方法预测血糖数据及影响因素,为患者提供个性化的控糖方案,如推荐适合的运动方式和强度,以及通过监测在保证患者营养的前提下推荐有针对性的食谱等。
从传统的糖尿病治疗方式发展到血糖的动态监测、分析数据、发现规律、提供治疗方案和管理建议,再到形成一个精准管理糖尿病的完整闭环以供系统进行深入分析,为医生提供建议,这一过程将实现以数据为基础的糖尿病个性化精准治疗及管理的巨大变化。不仅如此,通过机器学习乃至深度学习,其决策支持系统有可能会进一步发现医生发现不了的规律,从而推动糖尿病诊疗技术的进步。
无





















