
运用病案首页数据库,探讨分析我国第一批罕见病目录的121种疾病在我国三级甲等医院住院病例的基础数据,了解我国罕见病现状。
基于北京医学会罕见病分会前期罕见病调研的数据,对第一批罕见病目录中罕见病在全国96家三级甲等医院2014—2015年罕见病住院患者现况进行对比及描述性研究分析。
经与调研清单比对,第一批罕见病目录中有19种罕见病不在调研清单中,其余102种罕见病总例次为54 468例次,占同期住院总例次的0.35%。前10位最常见罕见病总例次为37 977例次,占同期住院总例次的0.25%。前10位最少见罕见病总例次为24例次,占同期住院总例次的0.000 16%。住院人群诊治罕见病种类最多的前5个省/直辖市分别为北京、湖南、上海、山东、广东,被收治的住院罕见病例次最多的前5个省/直辖市为北京、上海、广东、山东、湖北。年龄分布显示,25~64岁年龄组占45.8%,0~14岁年龄组占28.6%。罕见病前10位重复住院率为28.42%~64.88%。
本研究初步探索了第一批罕见病目录中121种罕见病在全国三级甲等医院住院人群中的例次、种类、省/直辖市分布、年龄分布及重复住院率等,为进一步建立全国范围内罕见病注册数据库及制定罕见病相关政策提供基础数据支撑。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
罕见病又称"孤儿病",指发病率极低,患病人口数量极少的一大类疾病。2016年Orphanet数据库年度报告指出目前罕见病6 900种以上[1]。
2018年5月,由国家卫生健康委员会、科学技术部、工业和信息化部、国家药品监督管理局、国家中医药管理局五部门联合发布了《第一批罕见病目录》,包括121种罕见病(以下统称为"目录")。此目录对于罕见病的临床诊治、药物研发、医疗救助、科研、医保和社会保障相关政策的制定等都具有重要的推进意义,在我国罕见病事业发展史上具有里程碑意义。
然而,我国罕见病领域的临床和研究尚属起步阶段,目前尚无全国范围内的罕见病流行病学调查数据库,严重制约开展相关工作[2]。为此,本研究基于国家卫生健康委员会医疗管理服务指导中心的住院病案首页数据库(以下统称为"病案首页数据库"),对我国三级甲等医院住院病例中《第一批罕见病目录》中121种罕见病的现况进行研究和分析。
病案首页数据库是基于住院人群、涵盖全国24个省/直辖市、96家三级甲等医院的2014—2015年期间15 458 065住院例次病案首页的数据。该数据库基于数据管理平台系统框架,自下而上包括数据集成层、数据存储与管理层、数据分析与挖掘层及分析结果展示层,经过病案首页上传、清洗、入库、查询输出、分析挖掘、结果报告等步骤输出研究结果,且全程数据经过安全控制及质量控制[3] 。本研究由数据库专业管理人员根据本研究目的及研究设计进入有限开放权限的数据库进行数据提取。
本研究以病案首页数据库中出院诊断符合《第一批罕见病目录》中疾病的患者为研究对象。本研究经作者所在医院伦理委员会批准。
调研清单综合了原国家卫计委专家建议的151种罕见病清单、北京医学会罕见病分会专家建议的121种罕见病清单、上海儿童医学中心陈静[4]主编的《可治性罕见病》中的117种罕见病清单、"国民经济和社会发展第十三个五年规划"国家重点研发计划精准医学研究重点专项项目罕见病临床队列研究的66种罕见病清单(2016YFC0901500)及山东省罕见病病例信息登记工作的68种罕见病清单,将上述汇集的罕见病去重以及逐一对照英文校对各个罕见病中文名称,继之运用"会议共识法"手段,组织进行了两轮"专家共识会",通过公开讨论、轮流发言、无记名投票等形式,对罕见病初步调研清单中纳入的疾病进行筛选,并对疾病中英文名称进行修订、完善,最终形成"罕见病调研清单"(以下简称为"调研清单")。以目录中的121种罕见病为研究对象,若目录中疾病在调研清单中,则进行描述性统计分析。
对调研清单中每个疾病,使用多视角卷积神经网络算法在病案首页数据库中进行疾病匹配[5]。以匹配结果为基础,以疾病为单位建立子数据库,每个疾病数据库由该疾病领域专家进行疾病去重复并根据每一种罕见病的中文译文名称代表的疾病定义对提取结果进行整理,确保提取数据的准确性。
对目录中罕见病住院患者数据进行基本统计描述,包括:2014年例次、2015年例次、总例次、罕见病种类、省/直辖市分布、年龄分布及重复住院率。连续变量采用
±s进行统计描述,分类变量采用频数及百分比进行统计描述。数据提取与统计分析均运用统计学软件R (3.5.1)。
目录中有19种罕见病不在调研清单中,其余102种罕见病在调研清单中。
(1)罕见病例次及省/直辖市分布:目录中102种罕见病总例次为54 468例次,占同期住院总例次的0.35% (54 468/15 458 065)。2014年总例次占同期住院患者的0.36% (26 475/7 429 813),2015年总例次占同期住院患者的0.35% (27 993/8 028 252)。目录中有14种罕见病未被检索到,另外88种罕见病中,前10位最多例次罕见病总例次占102种罕见病总例次的69.7% (37 977/54 468),占同期住院总例次的0.25% (37 977/15 458 065)。前10位最少例次罕见病总例次仅占102种罕见病总例次的0.04% (24/54 468),占同期住院总例次的0.000 16%(24/15 458 065)。各疾病对应的2014—2015年总例次见表1。(2)罕见病种类、总例次及省/直辖市分布:在病案首页数据库涵盖的24个省级行政单位中,住院人群诊治罕见病种类最多的前5个省/直辖市分别为北京、湖南、上海、山东、广东,其对应罕见病种类分别为76种、69种、62种、61种及59种,被收治的住院罕见病患者最多的前5个省/直辖市为北京、上海、广东、山东、湖北,其对应罕见病例次分别为13 770例次、3 875例次、3 726例次、2 815例次及2 637例次。(3)罕见病总例次的性别及年龄分布:两年所有罕见病患者总例次为54 468例次,其中男性为29 655例次,占54.4%;各年龄段例次及占比见表2。(4)罕见病重复住院率:重返例次是指将每种罕见病在病案首页数据库中的所有住院患者在同一医院重复住院次数总和。重复住院率是指重返例次占住院例次的百分比。重复住院率前10位疾病重复住院率范围为28.42%~64.88%,详情见表3。

目录中88种罕见病在病案首页数据库中的例次分布
目录中88种罕见病在病案首页数据库中的例次分布
| 目录编码 | 疾病名称 | 总例次 | 目录编码 | 疾病名称 | 总例次 |
|---|---|---|---|---|---|
| 54 | 特发性肺动脉高压 | 9 536 | 109 | 脊延髓肌萎缩症(肯尼迪病) | 101 |
| 60 | 朗格汉斯组织细胞增生症 | 7 657 | 120 | X-连锁肾上腺脑白质营养不良 | 93 |
| 4 | 肌萎缩侧索硬化 | 4 057 | 92 | 卟啉病 | 92 |
| 55 | 特发性肺纤维化 | 3 764 | 101 | 囊性纤维化 | 87 |
| 112 | 系统性硬化症 | 3 252 | 15 | 原发性肉碱缺乏症 | 86 |
| 37 | 肝豆状核变性 | 3 000 | 82 | 尼曼匹克病 | 86 |
| 102 | 视网膜色素变性症 | 1 852 | 51 | 低血磷性佝偻病 | 85 |
| 68 | 马凡综合征 | 1 751 | 27 | 法布雷病 | 69 |
| 46 | 纯合子家族性高胆固醇血症 | 1 714 | 99 | 丙酸血症 | 58 |
| 23 | 先天性脊柱侧弯 | 1 394 | 18 | 瓜氨酸血症 | 55 |
| 88 | 阵发性睡眠性血红蛋白尿 | 1 337 | 64 | 淋巴管肌瘤病 | 47 |
| 91 | POEMS综合征 | 1 213 | 5 | Angelman综合征 | 42 |
| 35 | 糖原累积病(Ⅰ型、Ⅱ型) | 1 178 | 20 | 先天性高胰岛素性低血糖血症 | 40 |
| 25 | 先天性纯红细胞再生障碍性贫血 | 1 113 | 67 | 枫糖尿症 | 40 |
| 114 | 结节性硬化症 | 1 064 | 28 | 家族性地中海热 | 32 |
| 98 | 进行性肌营养不良 | 926 | 94 | 原发性联合免疫缺陷 | 31 |
| 53 | 特发性低促性腺激素性性腺功能减退症 | 904 | 95 | 原发性遗传性肌张力不全 | 27 |
| 56 | IgG4相关性疾病 | 900 | 117 | 威廉姆斯综合征 | 20 |
| 8 | 非典型溶血尿毒综合征 | 532 | 62 | Leber遗传性视神经病变 | 19 |
| 73 | 黏多糖贮积症 | 507 | 26 | Erdheim-Chester病 | 18 |
| 71 | 甲基丙二酸血症 | 470 | 22 | 先天性肌强直(非营养不良性肌强直综合征) | 17 |
| 86 | 成骨不全症(脆骨病) | 469 | 38 | 遗传性血管性水肿 | 15 |
| 110 | 脊髓性肌萎缩症 | 389 | 52 | 特发性心肌病 | 15 |
| 29 | 范可尼贫血 | 350 | 84 | Noonan综合征 | 15 |
| 2 | 白化病 | 333 | 6 | 精氨酸酶缺乏症 | 14 |
| 87 | 帕金森病(青年型、早发型) | 315 | 115 | 原发性酪氨酸血症 | 14 |
| 16 | Castleman病 | 301 | 107 | Silver-Russell综合征 | 13 |
| 43 | 遗传性痉挛性截瘫 | 298 | 121 | X-连锁淋巴增生症 | 12 |
| 33 | Gitelman综合征 | 266 | 21 | 先天性肌无力综合征 | 10 |
| 17 | 腓骨肌萎缩症 | 264 | 30 | 半乳糖血症 | 10 |
| 3 | Alport综合征 | 250 | 104 | 重症先天性粒细胞缺乏症 | 8 |
| 90 | 苯丙酮尿症 | 246 | 13 | 生物素酶缺乏症 | 7 |
| 111 | 脊髓小脑性共济失调 | 168 | 19 | 先天性肾上腺发育不良 | 7 |
| 59 | 卡尔曼综合征 | 152 | 50 | 低碱性磷酸酶血症 | 7 |
| 89 | 黑板息肉综合征 | 149 | 61 | 莱伦氏综合征 | 7 |
| 74 | 多灶性运动神经病 | 139 | 118 | 湿疹血小板减少伴免疫缺陷综合征 | 5 |
| 69 | McCune-Albright综合征 | 136 | 97 | 进行性家族性肝内胆汁淤积症 | 4 |
| 49 | 高苯丙氨酸血症 | 126 | 75 | 多种酰基辅酶A脱氢酶缺乏症 | 2 |
| 78 | 肌强直性营养不良 | 125 | 34 | 戊二酸血症Ⅰ型 | 1 |
| 31 | 戈谢病 | 123 | 39 | 遗传性大疱性表皮松解症 | 1 |
| 47 | 亨廷顿舞蹈症 | 117 | 40 | 遗传性果糖不耐受症 | 1 |
| 119 | X-连锁无丙种球蛋白血症 | 109 | 41 | 遗传性低镁血症 | 1 |
| 105 | 婴儿严重肌阵挛癫痫(Dravet综合征) | 104 | 58 | 异戊酸血症 | 1 |
| 93 | Prader-Willi综合征 | 102 | 85 | 鸟氨酸氨甲酰基转移酶缺乏症 | 1 |
注:目录编码为目录中的疾病编码

目录中88种罕见病在病案首页数据库中总例次的年龄分布(例)
目录中88种罕见病在病案首页数据库中总例次的年龄分布(例)
| 年份 | 总例次 | 0~4岁 | 5~14岁 | 15~24岁 | 25~34岁 | 35~44岁 | 45~54岁 | 55~64岁 | 65~74岁 | 75~84岁 | >85岁 |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 2014 | 26 475 | 4 158 | 3 075 | 2 189 | 2 672 | 2 688 | 3 379 | 3 807 | 2 655 | 1 529 | 284 |
| 2015 | 27 993 | 4 717 | 3 577 | 2 183 | 2 626 | 2 618 | 3 506 | 3 626 | 2 775 | 1 846 | 470 |
| 合计 | 54 468 | 8 875 | 6 652 | 4 372 | 5 298 | 5 306 | 6 885 | 7 433 | 5 430 | 3 375 | 754 |
注:88例次患者年龄数据缺失

目录中重复住院率前10位罕见病
目录中重复住院率前10位罕见病
| 目录编码 | 疾病名称 | 重返例次 | 总例次 | 重复住院率(%) |
|---|---|---|---|---|
| 60 | 朗格汉斯组织细胞增生症 | 4 968 | 7 657 | 64.9 |
| 6 | 精氨酸酶缺乏症 | 9 | 14 | 64.3 |
| 119 | X-连锁无丙种球蛋白血症 | 44 | 109 | 40.4 |
| 118 | 湿疹血小板减少伴免疫缺陷综合征 | 2 | 5 | 40.0 |
| 8 | 非典型溶血性尿毒症 | 205 | 532 | 38.5 |
| 16 | Castleman病 | 111 | 301 | 36.9 |
| 25 | 先天性纯红细胞再生障碍性贫血 | 365 | 1 113 | 32.8 |
| 101 | 肺囊性纤维化 | 28 | 87 | 32.2 |
| 91 | POEMS综合征 | 390 | 1 213 | 32.2 |
| 88 | 陈发性睡眠性血红蛋白尿 | 380 | 1 337 | 28.4 |
注:目录编码为目录中的疾病编码
本研究提示总例次最多的前10位罕见病例次范围为1 394~9 536例次,表明有些罕见病在我国总的发病人数并不少见,应引起足够的重视。这些疾病应编入疾病目录并进行归类,充分认识这类疾病,有利于给予病人及时恰当的治疗。
根据国内罕见病相关文献报道[6,7,8,9,10,11,12,13,14,15,16,17] ,对于前10位最少见罕见病,多个文献报道的数量总和,甚至某些单中心报道的例数多于本研究结果的例次,此结果可能与某些种类罕见病仅在门诊就诊而不收住院治疗有关,也可能与病案首页数据库未囊括全国所有医院有关。
由于患者的籍贯等信息属于保密信息,本文的省市分布为诊治医院分布情况。省/直辖市分布显示,罕见病患者大多数集中分布在北京、上海、广东及山东,这提示更多的罕见病患者到这些省市就医,另外,也间接反映这些省市的三甲医院更具备诊治罕见病的能力。
两年数据显示罕见病诊治例次占同期住院患者例次的比例基本相同(0.36%和0.35%),提示罕见病住院诊治情况在我国基本平稳。年龄分布显示,25~64岁年龄组占45.8%,提示劳动力人群占极大比例,反映了罕见病对家庭、社会及医疗的影响;0~14岁年龄组占28.6%,提示儿童是罕见病住院患者的重要组成部分。总罕见病住院患者例次以及各省/直辖市分布、年龄分布等情况有助于在制定相关医保、救助等罕见病政策时作为参考数据。此外,本研究从病案首页数据库中提取的罕见病重复住院率的数据,尽管目前病案首页数据库尚不能提供相应的医疗支出详情,但仍然有助于分析了解相关罕见病的医疗负担。
在大数据策略指导下,基于疾病数据库中的疾病信息进行数据挖掘,是疾病流行病学研究的有效方法[16] 。我国罕见病调研缺乏全国性的流行病学数据,此调研工作以全国三级甲等医院的1 545万例次住院病例的病案首页为基础,经过严谨的数据提取及清理,由于某些罕见病方面没有准确的ICD-10编码或多种疾病名称,因此对数据必须进行人工二次核查,以确保数据信息的准确性。本研究可提供第一批罕见病目录中84.3%的疾病的例次及省/直辖市分布情况,为各级政府机构制定医疗保障、大病救助、孤儿药研发等相关政策[17,18,19]提供基础数据资料。
本研究存在一些局限性。罕见病病例数可能被低估,首先,数据库中患者为住院患者,而很多罕见病患者可能仅在门诊就诊。其次,尽管数据库内医院为三级甲等医院,且均为省级行政单位的委属(管)医院、卫/教共建医院或大型公立医院,很可能代表了具有诊治疑难重症能力的医疗机构,但并未能囊括所有三级甲等医院。另外,由于数据库中患者的身份信息属于保密信息,无法实现跨医院个体识别,因此得到的重返例次仅为在同一医院重复住院的例次。
总之,本研究通过比对第一批罕见病目录与北京医学会罕见病分会前期罕见病调研清单的疾病种类,初步探索了第一批罕见病目录中罕见病在全国三级甲等医院住院人群中的例次、种类、省/直辖市分布、年龄分布及重复住院率,为进一步建立全国范围内罕见病注册数据库及制定罕见病相关政策提供基础数据支撑。
国家卫生计生委医疗管理服务指导中心;北京医学会罕见病分会





















