分析2005-2017年全国布鲁氏菌病(布病)重复报告(重报)现状,了解重报对布病报告发病率的影响,分析可能的重报原因,提出解决策略,进一步提高布病监测数据质量。
数据来源于全国传染病报告信息管理系统(National Notifiable Disease Report System,NNDRS)布病报告个案卡,使用Excel 2010软件建立数据库,利用Python 3.2软件中Spark DataFrame的聚合分析实现重报分析。
全国2005-2017年共报告499 577张布病个案卡,布病重报率为75.76/万(3 785/499 577),年内重报率为37.21/万(1 859/499 577),跨年度重报率为39.87/万(1 992/499 577),重报病例整体呈逐年上升趋势,同一机构、跨机构的重报率占比分别为33.59%(1 271/3 785)、66.41%(2 514/3 785)。不同类型医疗机构中,医院重报数最多(2 757),社区卫生服务中心的重报率最高为281.27/万(123/4 373)。2017年全国报告发病率为2.926 4/10万,去除布病重报个案后,矫正发病率为2.844 8/10万,降幅为2005-2017年的最大值,矫正发病率下降2.79%。2005-2017年新疆维吾尔自治区(新疆)年平均报告发病率为14.712 0/10万,去除布病重报个案后,矫正发病率为14.060 0/10万,降幅为全国最大值4.43%,宁夏回族自治区(宁夏)年平均报告发病率为13.987 1/10万,矫正发病率为13.662 2/10万,降幅为2.32%,排第二位。布病病例年内、年度间在同一机构、不同机构的反复就诊,包括异地就诊等是造成重复报告的主要原因。
2005-2017年我国布病重报整体呈上升趋势,医院、社区卫生服务中心均存在不同程度的重报,以跨机构、跨年度重报为主。重报对新疆、宁夏等省份的发病率统计影响较大,建议进一步加强布病报告管理要求,改进NNDRS,提高数据质量。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
布鲁氏菌病(布病)是由布鲁氏菌属引起的人兽共患传染病[1],是我国法定乙类传染病[2]。主要是通过职业性或环境接触病畜或其制品而感染,也可通过吸入含有布鲁氏菌的气溶胶或摄入未经巴氏消毒的乳制品或不熟的内脏而感染[3]。我国于2004年1月1日起正式启动全国传染病报告信息管理系统(National Notifiable Disease Report System,NNDRS)[4],布病实现了基于网络直报模式的个案报告,全国范围内统一要求各级医疗卫生机构在诊断布病24 h内,通过NNDRS填报个案报告卡[5]。网络直报可供分析挖掘的有效信息丰富,但当NNDRS报告的个案存在较多的重报时,将直接影响对疫情真实水平的分析与研判。由于慢性布病患者病情迁延,反复就诊、异地就诊率高[6],因而在NNDRS中易造成重复报告。但目前我国尚未有对布病的重报问题进行分析的报道,为此本研究对我国2005-2017年在NNDRS中上报的布病病例的重报情况进行分析,以期了解医疗机构布病病例重报现状,分析重报的原因并提出解决策略。
我国NNDRS数据库中2005年1月1日至2017年12月31日的所有布病病例报告数据。
重报判定条件[7]:①筛选出性别、现住址编码、出生日期3项完全相同可能属于重报的布病病例;②人工甄别姓名是否相同(同音同字;3字名字中任2字相同,而另外1字为音同字不同;2字名字中任1字相同,另外1字音同字不同;以上3种情况均按姓名相同处理),姓名相同者按照重报处理;③针对名字中1或2个字的音不同字结构相似者通过身份证进一步审核,个别也无身份证信息的根据患者的职业分类与发病日期综合分析判断病例是否属于重报(图1)。
根据"中国CDC法定传染病发病和死亡报告",重报率(/万)=一定时期(月、年)内重报的布病个案数/同期累计报告布病个案总数×10 000。年内重报是指该年度内(录入时间从1月1日到12月31日)布病个案重报情况,使用年内重报数和年内重报率作为统计指标。累计重报是指截止到当前时期所有累计布病个案重报情况,使用累计重报数和累计重报率作为统计指标。跨年度重报是指本年度布病报告个案与历史年度布病报告个案出现重报的情况,使用跨年度重报数和跨年度重报率作为统计指标。矫正发病率是指去除布病重报个案后布病的报告发病率。计算公式:①年内重报率(/万)=(年内布病重报数/年度报告布病个案总数)×10 000;②跨年重报率(/万)=(跨年布病重报数/同期报告布病个案总数)×10 000;③累计重报率(/万)=(累计布病重报数/同期累计报告布病个案总数)×10 000;④矫正发病率(/10万)=(报告病例数-重报病例数)/人口数)×100 000,人口数据来源于国家统计局《中国统计年鉴》[8]。
使用Excel 2010软件建立数据库,利用Python 3.2软件中Spark DataFrame的聚合分析实现查重分析,根据查重条件对卡片进行聚合得到卡片重复的分组集合,重卡数即聚合结果报告卡记录总数减去聚合组合计数。具体指标统计方法:对各历史年度报告卡按照年度内查重条件分别进行聚合分析,即得到各历史年度的年度内重复报告卡片数。对截止年份及之前年度的所有报告卡按照跨年度查重条件进行聚合分析,即得到各截止年度的累计重卡数。任意跨年度重卡是按照跨年度查重条件进行两个年度间报告卡聚合分析,排除其中年度内重卡即跨年度重卡数。重报1次计1例,重报2次计2例,以此类推。
(1)年度内重报:2005-2017年全国共报告499 577张布病个案卡,年内重报共1 859张,年内重报率为37.21/万(1 859/499 577)。2005-2016年的年内重报数、重报率整体呈递增趋势,2017年有所下降,年内重报率最高为2016年的105.99/万(525/49 535),最低的是2006年的1.97/万(4/20 324),2016年跨机构重报占比最高为85.52%(449/525)。年度内重报率、重报数及机构重报情况(图2)。
(2)跨年度重报:2005-2017年布病跨年度重报共1 992张,跨年度重报率为39.87/万(1 992/499 577),高于年内重报,整体呈现递增趋势。2017年跨年度重报数最多为778张,年度构成比为2016年59.64%(464/778)、2015年18.77%(146/778)、2014年11.95%(93/778)和2005-2013年9.64%(75/778),跨年度重报情况(表1)。
年份 | 2005年 | 2006年 | 2007年 | 2008年 | 2009年 | 2010年 | 2011年 | 2012年 | 2013年 | 2014年 | 2015年 | 2016年 | 合计 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2006 | 2 | - | - | - | - | - | - | - | - | - | - | - | 2 |
2007 | 1 | 1 | - | - | - | - | - | - | - | - | - | - | 2 |
2008 | 1 | 1 | 7 | - | - | - | - | - | - | - | - | - | 9 |
2009 | 0 | 0 | 0 | 9 | - | - | - | - | - | - | - | - | 9 |
2010 | 0 | 0 | 1 | 8 | 10 | - | - | - | - | - | - | - | 19 |
2011 | 1 | 0 | 2 | 0 | 9 | 27 | - | - | - | - | - | - | 39 |
2012 | 0 | 2 | 1 | 2 | 2 | 6 | 40 | - | - | - | - | - | 53 |
2013 | 0 | 0 | 0 | 4 | 1 | 10 | 8 | 70 | - | - | - | - | 93 |
2014 | 0 | 2 | 0 | 1 | 6 | 11 | 21 | 24 | 104 | - | - | - | 169 |
2015 | 0 | 0 | 1 | 3 | 1 | 6 | 9 | 19 | 46 | 226 | - | - | 311 |
2016 | 0 | 0 | 1 | 1 | 2 | 5 | 8 | 17 | 28 | 112 | 334 | - | 508 |
2017 | 0 | 0 | 1 | 1 | 4 | 3 | 12 | 19 | 35 | 93 | 146 | 464 | 778 |
(3)累计重报:①2005-2017年全国累计重报病例呈上升趋势,其中3 383张(94.63%)被报告2次,175张(4.90%)被报告3次,16张(0.45%)被报告4次,1张(0.02%)被报告5次,累计3 785张重卡,累计重报率为75.76/万(3 785/499 577)。同一机构、跨机构的重报率占比分别为33.59%(1 271/3 785)和66.41%(2 514/3 785)。2017年全国报告发病率为2.926 4/10万,去除布病重报个案后,矫正发病率为2.844 8/10万,降幅为2005-2017年间的最大值,矫正发病率下降2.79%,2006年全国报告发病率为1.554 3/10万,去除布病重报个案后,矫正发病率为1.553 9/10万,降幅为2005-2017年的最小值,矫正发病率下降0.03%(表2)。②全国各个地区的重报情况差异较大,布病重报数排名前4位的省份为新疆维吾尔自治区(新疆)、内蒙古自治区(内蒙古)、山西和宁夏回族自治区(宁夏)。重报率排名前4位的省份为新疆、宁夏、甘肃和广东。去除重报个案,新疆、宁夏等省份发病率降幅较大(表3)。
年份 | 重报数 | 重报率(/万) | 报告发病数 | 报告发病率(/10万) | 矫正发病率(/10万) | 发病率降幅(%) |
---|---|---|---|---|---|---|
2005 | 7 | 3.55 | 19 694 | 1.515 1 | 1.514 5 | 0.04 |
2006 | 6 | 2.95 | 20 324 | 1.554 3 | 1.553 9 | 0.03 |
2007 | 15 | 7.04 | 21 292 | 1.619 8 | 1.618 7 | 0.07 |
2008 | 24 | 8.14 | 29 486 | 2.231 6 | 2.229 8 | 0.08 |
2009 | 36 | 9.68 | 37 171 | 2.799 0 | 2.796 3 | 0.10 |
2010 | 48 | 13.67 | 35 124 | 2.631 5 | 2.627 9 | 0.14 |
2011 | 104 | 24.38 | 42 663 | 3.181 6 | 3.173 9 | 0.24 |
2012 | 124 | 30.31 | 40 912 | 3.036 5 | 3.027 3 | 0.30 |
2013 | 251 | 55.93 | 44 876 | 3.314 2 | 3.295 7 | 0.56 |
2014 | 373 | 63.55 | 58 691 | 4.330 9 | 4.303 4 | 0.64 |
2015 | 704 | 118.46 | 59 430 | 4.361 9 | 4.310 3 | 1.18 |
2016 | 1 033 | 208.54 | 49 535 | 3.613 6 | 3.538 3 | 2.09 |
2017 | 1 126 | 278.86 | 40 379 | 2.926 4 | 2.844 8 | 2.79 |
省(直辖市、自治区) | 重报数 | 重报率(/万) | 报告发病数 | 报告发病率(/10万) | 矫正发病率(/10万) | 发病率降幅(%) |
---|---|---|---|---|---|---|
新疆 | 1 849 | 443.24 | 41 716 | 14.712 0 | 14.060 0 | 4.43 |
宁夏 | 267 | 232.25 | 11 496 | 13.987 1 | 13.662 2 | 2.32 |
甘肃 | 145 | 170.21 | 8 519 | 2.552 7 | 2.509 3 | 1.70 |
广东 | 25 | 138.20 | 1 809 | 0.136 9 | 0.135 0 | 1.38 |
湖北 | 10 | 77.40 | 1 292 | 0.172 6 | 0.171 3 | 0.77 |
广西 | 5 | 84.89 | 589 | 0.095 4 | 0.094 6 | 0.85 |
江西 | 2 | 84.03 | 238 | 0.041 2 | 0.040 8 | 0.84 |
贵州 | 3 | 66.08 | 454 | 0.097 4 | 0.096 7 | 0.66 |
山东 | 125 | 72.46 | 17 252 | 1.388 9 | 1.378 8 | 0.72 |
山西 | 436 | 63.94 | 68 188 | 14.921 4 | 14.826 0 | 0.64 |
陕西 | 58 | 50.69 | 11 441 | 2.354 2 | 2.342 2 | 0.51 |
北京 | 5 | 46.47 | 1 076 | 0.437 4 | 0.435 4 | 0.46 |
浙江 | 4 | 46.67 | 857 | 0.123 9 | 0.123 3 | 0.47 |
云南 | 4 | 38.28 | 1 045 | 0.174 8 | 0.174 1 | 0.38 |
辽宁 | 65 | 36.26 | 17 927 | 3.181 3 | 3.169 8 | 0.36 |
四川 | 1 | 32.68 | 306 | 0.028 9 | 0.028 8 | 0.33 |
内蒙古 | 455 | 30.96 | 146 980 | 45.902 6 | 45.760 5 | 0.31 |
河南 | 77 | 28.15 | 27 354 | 2.227 1 | 2.220 8 | 0.28 |
黑龙江 | 155 | 23.89 | 64 880 | 13.050 4 | 13.019 2 | 0.24 |
安徽 | 1 | 21.46 | 466 | 0.058 8 | 0.058 7 | 0.21 |
河北 | 85 | 17.66 | 48 119 | 5.181 9 | 5.172 8 | 0.18 |
江苏 | 1 | 16.42 | 609 | 0.059 9 | 0.059 8 | 0.16 |
天津 | 2 | 15.30 | 1 307 | 0.776 8 | 0.775 6 | 0.15 |
吉林 | 5 | 2.08 | 23 996 | 6.742 9 | 6.741 5 | 0.02 |
上海 | 0 | 0.00 | 42 | 0.014 6 | 0.014 6 | 0.00 |
湖南 | 0 | 0.00 | 569 | 0.066 7 | 0.066 7 | 0.00 |
青海 | 0 | 0.00 | 309 | 0.421 0 | 0.421 0 | 0.00 |
西藏 | 0 | 0.00 | 66 | 0.168 6 | 0.168 6 | 0.00 |
重庆 | 0 | 0.00 | 181 | 0.048 0 | 0.048 0 | 0.00 |
福建 | 0 | 0.00 | 438 | 0.091 2 | 0.091 2 | 0.00 |
海南 | 0 | 0.00 | 56 | 0.049 5 | 0.049 5 | 0.00 |
全国 | 3 785 | 75.76 | 499 577 | 2.886 9 | 2.865 1 | 0.76 |
统计分析2005-2017年全国NNDRS中医疗机构布病重报构成情况,去除58张无报告单位的个案缺失值,对剩余的3 727张个案进行分析,发现医院重报数最多,社区卫生服务中心重报率最高(表4)。
医疗机构类型 | 重报数 | 重报数构成比(%) | 报告个案总数 | 重报率(/万) |
---|---|---|---|---|
医院 | 2 757 | 73.97 | 168 403 | 163.71 |
疾病预防控制中心 | 467 | 12.53 | 274 200 | 17.03 |
卫生院 | 351 | 9.42 | 295 38 | 118.83 |
社区卫生服务中心 | 123 | 3.30 | 4 373 | 281.27 |
专科疾病防治院 | 23 | 0.62 | 15 598 | 14.75 |
其他 | 6 | 0.16 | 7 465 | 8.04 |
合计 | 3 727 | 100.00 | 499 577 | 74.60 |
2005-2017年NNDRS中存在75.76/万的布病重报个案,远低于我国乙型肝炎、手足口病、梅毒和肺结核的重报现状[9]。重报病例整体呈逐年上升趋势,由2005年的3.55/万,增长到2017年的278.86/万,年内与跨年度重报、同一机构与跨机构重报同时存在。年内重报率为37.21/万,2006-2016年度内重报数、重报率逐年递增,2016年年内重报率最高达105.99/万,2017年有所下降,下降原因可能与2017年布病重报率较高的几个省份报告发病率大幅降低有关,如2017年新疆和宁夏报告发病率较2016年分别降低了22.86%和22.30%。跨年度重报率为39.87/万,2017年跨年度重报数最多为778张。跨机构重报高于年内重报,同一机构重报占比33.59%,跨机构重报为66.41%,其中2016年跨机构重报占比最高为85.52%,另外,有研究显示[6],2004-2012年全国布病患者异地就诊率达38%,异地就诊数的9年平均增长率为23.34%。提示我国布病重报可能是因为病例反复就诊、异地就诊等原因造成。对全国布病重报医疗机构分布情况分析发现,医院重报数最多,社区卫生服务中心重报率最高,虽CDC报告布病个案数最多,但重报率仅是医院、卫生院与社区卫生服务中心的6.05%~14.33%,提示要增加对医院、卫生院和社区卫生服务中心的报告管理力度,建议将病例查重纳入常态化疫情管理中,为准确掌握布病疫情提供数据保证。
去除布病重报个案后,2005-2017年全国矫正后的报告发病率下降了0.03%~2.79%,各省份重报情况差异较大,新疆、内蒙古、山西和宁夏等省份重报数较多,可能与该地区本身发病率较高有关。对各地区布病重报率分析发现,新疆仍然排首位,这可能与新疆人多数姓名较长,尤其维吾尔族人姓名含有"·"或空格符号,而且信息化程度较低有关,布病信息的上报和汇总统计多由人工填报,此过程填写错误的问题在所难免,极易造成NNDRS无法甄别而发生重报。虽然2005-2017年内蒙古的报告发病数(146 980)高于新疆(41 716),但重报数和重报率(455,30.96/万)均低于新疆(1 849,443.24/万),这与内蒙古畜牧部门加强监督有很大关系。建议在加强我国西北方省份的信息化建设的同时,也要加强对新疆、宁夏和甘肃等省份的布病报告的督导管理力度。
针对我国2005-2017年布病重报病例整体呈上升趋势的现状,第一,要定期对高危地区高危人群进行筛查,确保早发现、早诊断、早治疗,尽量避免发展为慢性感染者,减少患者因反复就诊、异地就诊等原因造成的重报。第二,目前NNDRS中可管理的主要是年度内重报,但2005-2017年的NNDRS中仍存在37.21/万的布病年内重报率,提示目前我国布病网络报告管理仍有待提高,需进一步统一、规范全国布病报告管理要求。第三,由于跨年度重报计算量大,传统NNDRS构架难以满足在线计算需要,所以目前NNDRS一直未能实现跨年度的重报管理[9],但我国包括布病在内的较多传染病重报都逐渐以跨年度重报为主[9,10],所以建议引入大数据平台强大的计算能力进行跨年度重报的筛选管理。
对于传染病重报查询方法,多篇文章显示"姓名"汉字的书写对数据库查重影响较大[10,11]。为了尽量减少影响,本研究尝试用计算机筛选出"性别、出生日期、现住址编码"3项完全相同的个案,用名字以及身份证号码人工逐一甄别的方法,尽可能减小因姓名原因导致的低估查重结果。但布病存在再感染问题,对于确诊的再感染病例,跨年度重报数据则可能有所高估,需要进一步研究解决。
综上所述,2005-2017年我国NNDRS中布病重报率为75.76/万,且重报整体呈逐年上升趋势,重报主要发生在社区卫生服务中心,主要以跨机构、跨年度重报为主,其中对新疆、宁夏等省份的发病率统计影响较大,建议进一步提高布病报告管理要求,改进NNDRS,提高数据质量。
利益冲突 所有作者均声明不存在利益冲突