
了解孤独症谱系障碍(ASD)队列研究现状,探讨基于真实世界数据(RWD)构建ASD专病队列的可行性。
检索、筛选主要中英文数据库中截至2022年12月发表的ASD队列研究,归纳ASD队列研究特点。
共纳入ASD队列研究1 702篇,我国仅有60项(3.53%)。筛选出ASD相关队列163个,其中55.83%为出生队列,28.22%为ASD专病队列,4.91%为ASD高危人群队列;多数队列利用医院注册登记等RWD或开展社区现场调查获取研究对象信息,并通过量表或临床诊断确认ASD患者。研究内容包括ASD发生及预后相关危险因素研究、ASD共病模式研究及ASD对自身其他健康状况和对子代健康影响的研究。
目前发达国家ASD队列研究全面丰富,我国仍处于起步阶段。RWD为ASD专病队列构建提供了数据基础,也带来了研究的新机遇,但仍需开展病例验证等工作保证队列建设的科学性。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
孤独症谱系障碍(autism spectrum disorder,ASD)是一组以社交沟通障碍、兴趣或活动范围狭窄以及重复刻板行为为主要特征的神经发育性障碍,一般在3岁前发病,严重影响儿童青少年的身心健康。近年来,ASD呈现上升趋势,全球患病率约为1%[1],我国为26.50/10 000[2],男性高于女性;2020年美国CDC的数据显示,0~8岁儿童的累积ASD发病率为13.2/1 000[3]。目前ASD的发病机制尚不明确,但遗传和环境因素会影响ASD的发生发展,如家族史、高龄父母、妊娠期环境污染暴露史、早产等[4]。现有ASD治疗方法以教育干预、行为矫正为主,药物治疗为辅。ASD的行为干预包括分析疗法、孤独症和相关沟通障碍儿童治疗与教育、人际关系发展干预等[5],临床上常以非典型抗精神病药物缓解重复行为、多动和易怒等症状[6],但相关疗效仍有待提升。
既往ASD研究多采用病例对照设计,因果推断能力有限[7]。而队列研究鉴于其可建立暴露与疾病间因果关联的特性,能为ASD提供等级较高的研究证据。由于ASD的疾病特征,难以在患者中开展常规随访工作或随访内容难以满足研究需求。建立ASD专病队列则为探索有效的治疗模式、分析预后影响因素提供了研究场景。随着电子健康档案的完善、互联网患者社区的兴起,基于真实世界数据(real-world data,RWD)构建ASD专病队列,能够有效规避传统的以医疗机构或社区为基础的专病队列所面临的高研究成本[8],为开展ASD研究提供了新机遇。另一方面,近年来国内外已有多个大型ASD队列探索发病风险和预后情况,但缺乏对这些队列的综合性评价。因此,本研究采用概括性评价的方法系统检索文献[9],整合既往ASD队列研究,总结不同队列的优势与局限性,旨在为基于RWD构建ASD专病队列提供科学依据。
1. 文献检索:检索主要中英文数据库:中国知网、万方数据知识服务平台、维普数据库、SinoMed、PubMed、Cochrane Library、Embase、Web of Science、Scopus和Proquest,以及临床试验注册平台:Clinical trials和International Clinical Trial Registration Platform。检索时间从建库至2022年12月31日。根据不同数据库的特点,采用主题词结合题目、摘要、关键词的方式,检索词主要包括:①疾病:“孤独症” “自闭症” “孤独性障碍” “孤独症谱系障碍” “广泛发育障碍”等;②研究类型:“队列研究” “纵向研究” “随访研究”等。此外,本研究补充检索了ASD队列官方网站,以收集更详细的信息。
2. 文献筛选:由两组研究者根据纳入排除标准独立完成文献筛选,根据标题和摘要进行初筛后进一步阅读全文进行复筛,如遇分歧,则咨询第三方协助判断,缺乏的资料通过拓展检索网站和联系作者等方式予以补充,确定最终纳入文献。纳入标准:①队列研究;②研究的暴露或结局为ASD。排除标准:①动物研究;②综述类研究;③重复发表;④无法获取全文。
3. 信息提取:一组研究者预先确定了关键信息的提取条目,对确定纳入的文献进行信息提取,并由另一组研究者对提取的内容进行核对,如有分歧,则互相讨论或咨询第三方协助以确定最终结果。资料提取内容:文献基本特征(题目、作者、发表年份)、队列名称、所属机构、研究时间(基线调查、随访结束时间或随访时长)、研究地区、研究人群(纳入排除标准、抽样方法、样本量、人口学特征)、研究目的、研究设计(队列类型、ASD评估方法等)、队列的优势与局限性等。
4. 整合与分析:按照队列基本特征(包括国家/地区、时间、类型等)将提取的信息分类,归纳汇总相同特征的队列信息,并采用构成比描述纳入研究的地区和时间分布,总结不同类型的ASD相关队列中具有代表性的大型队列的优势与局限性,提炼队列的主要研究设计与研究内容,进而探究ASD相关队列的发展趋势和研究情况。
1. 文献基本特征:按限制条件检索数据库,获得文献67 797篇。剔除重复文献13 281篇,根据标题与摘要剔除52 187篇,根据原文剔除627篇,最终确定纳入研究的文献共1 702篇,其中中文文献14篇、英文文献1 688篇(图1)。


注:aInternational Clinical Trial Registration Platform:国际临床试验登记平台
在提供了确切队列起始时间的文献(1 060篇)中,最早的队列始于1943年,最晚的始于2021年,1990年之前建立的队列较少(110篇,10.38%),1993-2002年呈现快速上升趋势,2003-2008年保持在一个稳步上升的阶段,2008年以后开展的研究数量呈现下降趋势,2016-2020年仅有75项(7.08%)(图2)。


注:由于1990年之前建立的队列较少(110篇),未列出
在1 702项研究中,有11个国家/地区开展超过15项研究,有18项多中心研究。研究以欧洲地区、美国为主,美国最多(488项,28.67%),英国179项(10.52%)、瑞典115项(6.76%)、丹麦97项(5.70%);中国较少,仅有60项(3.53%)(表1)。

孤独症谱系障碍相关队列研究地区分布情况
孤独症谱系障碍相关队列研究地区分布情况
| 国家/地区 | 研究数量(项) | 构成比(%) |
|---|---|---|
| 美国 | 488 | 28.67 |
| 英国 | 179 | 10.52 |
| 瑞典 | 115 | 6.76 |
| 丹麦 | 97 | 5.70 |
| 加拿大 | 78 | 4.58 |
| 澳大利亚 | 62 | 3.64 |
| 中国 | 60 | 3.53 |
| 新西兰 | 53 | 3.11 |
| 法国 | 33 | 1.94 |
| 以色列 | 29 | 1.70 |
| 芬兰 | 16 | 0.94 |
| 其他 | 492 | 28.91 |
2. ASD队列研究概况:全部研究中共有376项涉及的163个队列有明确命名,19项研究涉及2个及以上队列。其中,36项(9.57%)研究源自父母和儿童埃文郡纵向研究(ALSPAC),分别有16项(4.26%)研究源自英国婴幼儿孤独症同胞研究中心(BASIS)、瑞典斯德哥尔摩青年队列(SYC),15项(3.99%)源自R世代研究,14项(3.72%)源自瑞典儿童和青少年双生子研究(CATSS)。在明确命名的163个队列中,有7个(4.29%)跨国队列在欧洲地区开展,其他队列主要集中在北美、欧洲和大洋洲地区,美国数量最多(47个,28.83%),其次是澳大利亚(19个,11.66%),亚洲地区中国(10个,6.13%)和日本(6个,3.68%)的队列数量较多,南美洲地区只有2个(1.23%),而非洲地区无队列开展。135个队列提供了明确的基线调查时间,集中在1970-2018年,65.19%的队列开展在1990-2010年,其中1995-1999年队列建立数量呈快速上升趋势,2000-2004年逐渐减少,2005-2010年呈缓慢上升趋势后基本保持稳定水平,只有14.81%开展于2011年后。163个队列可大致分为出生队列(55.83%)、ASD高危人群队列(4.91%)、ASD专病队列(28.22%)和自然人群队列(11.04%)。多数队列利用医院注册登记等RWD或开展社区现场调查获取研究对象信息,仅BASIS和早期孤独症风险纵向调查(EARLI)通过互联网招募。各队列主要通过筛查量表和临床诊断信息判断研究对象是否患ASD。研究样本量在900~450 000人之间,出生队列样本量均>5 000人,其中SYC高达44万人。根据不同队列类型,队列随访方式主要包括:①出生队列主要采取与政府部门合作获取患儿出生登记信息并进行电话随访的方式;②专病队列主要通过国家医疗保险系统获取患者长期就诊信息;③高危人群队列主要通过医院信息系统获取诊疗信息并通过问卷或访谈进行随访。大部分队列随访时间较长,半数以上队列仍在进行中,但部分队列存在研究数据时效性或准确性不够、研究人群代表性不足等问题。根据不同队列类型,既往ASD队列研究主要内容:①出生队列:探索一般人群ASD危险因素,包括家庭相关因素(如精神障碍家族史和母亲孕期用药史等)[10, 11, 12, 13]、环境/社会因素(如环境污染程度、文化程度)[14, 15]和其他暴露因素[如疫苗接种史、注意缺陷与多动障碍(ADHD)等][16, 17];②ASD高危人群队列:研究高危人群ASD发生发展,如ASD症状、认知功能、神经发育等状况[18, 19];③自然人群队列:描述ASD发病、患病分布[20];④ASD专病队列:分析ASD与其他疾病(如精神疾病、胃肠道疾病等)共病情况[21, 22, 23];随访ASD患者预后,包括行为能力发展(如语言能力、社会交往能力、独立生活能力)[24]、神经发育状况[25]和其他结局(如胃肠菌群状态、生活质量、对父母的依赖等)[26]。
3. 主要ASD队列介绍:本研究梳理了主要的ASD专病、高危人群队列和出生队列[8,27, 28, 29, 30, 31]的特征并着重介绍了国内外具有代表性队列的优势和局限性(表2)。孤独症出生队列(ABC),是挪威母亲和儿童队列研究(MoBa)的子队列,1999年开始,2009年结束。该队列的优势为拥有分析基因-环境交互作用所需的数据;局限性在于队列成员为选择性招募,计算患病率或发病率时可能存在偏倚[27]。BASIS是于2008建立,至今仍在进行中的ASD高危人群队列,旨在在儿童生长发育早期识别ASD潜在风险并实施干预[28]。已有16项ASD研究用到该队列,其通过互联网发布招募信息,符合条件的人群可自行登录网页进行注册成为研究对象,因此队列样本量大且相较传统队列省时省力,对于后期随访数据的管理更加便捷高效;但这种招募方式同样会带来选择偏倚。ALSPAC是从1991年至今在英国埃文郡开展的出生队列[29]。已有32项ASD队列研究源自该队列。队列采集医院、社区和学校三方面的数据,样本量大且数据丰富;随访频率高、失访率低,可重复测量,增加了研究的可靠性。但该队列仅有10%的样本收集到了5岁前的详细数据,后续招募过程不完善,且与全国人口相比该地区较富裕、种族集中,研究人群代表性不足[29]。依托中国国家出生队列建立的ASD亚队列于2019年1月正式启动。该队列同步纳入且平行随访采用辅助生殖技术(ART)的家庭和自然妊娠家庭,可评价ART对子代神经发育与行为能力发展的影响[8]。但由于ASD实际发病率很低且确诊程序较复杂,目前该队列样本量稍显不足。马鞍山市出生队列始于2008年,是研究孕期环境暴露对儿童生长发育影响的出生队列,其系统、全面地收集了5 084对母婴的环境暴露以及出生结局信息[30, 31],已有6项队列研究源于该队列。该队列随访率高、调查质量好,但仅使用量表筛查儿童ASD发病情况,缺少临床明确诊断,在计算患病率时可能存在偏倚。

主要孤独症谱系障碍(ASD)队列基本信息
主要孤独症谱系障碍(ASD)队列基本信息
| 队列名称 | 地区 | 时间 | 队列类型 | 研究对象 | 招募方式 | 随访方式 | 样本量(例) | ASD患者的定义 |
|---|---|---|---|---|---|---|---|---|
| ABC[27] | 挪威 | 1999-2009年 | 专病队列 | MoBa队列中的ASD患儿以及根据出生日期(±14 d)匹配的非ASD患儿 | 医疗机构注册登记 | 问卷调查、医院信息系统 | 1 033 | 通过36个月筛查SCQ;具备医疗系统的专业转诊信息;具备父母的自行转诊信息;能够链接ASD患者数据库信息 |
| BASIS[28] | 英国 | 2008年至今 | 高危人群队列 | 家系中最早罹患ASD成员的兄弟姐妹 | 互联网平台 | 访谈、医院信息系统 | 不详 | 未提及 |
| ALSPAC[29] | 英国 | 1991年至今 | 出生队列 | 埃文郡预产期在1991年4月至1992年12月间的孕妇分娩的所有新生儿 | 社区现场调查 | 问卷调查、医院信息系统 | 14 541 | 2003-2004年PLASC数据中被列为主要或次要关注重点;医院诊疗记录、社区儿童健康记录通过专家评估 |
| SYC[32] | 瑞典 | 2001-2007年 | 出生队列 | 2001-2007年居住在斯德哥尔摩省的儿童 | 总人口注册登记 | 链接国家卫生保健和行政注册登记库 | 444 154 | DSM-Ⅳ或ICD-10 |
| Generation R[33] | 荷兰 | 2002-2006年 | 出生队列 | 研究地区内预产期在2002年4月至2006年1月间的孕妇分娩的所有新生儿 | 医疗机构注册登记 | 问卷调查、访谈 | 9 778 | 通过社会回应量表评估 |
| CATSS[34] | 瑞典 | 1992年至今 | 出生队列 | 1992年7月后所有在瑞典出生的双胞胎 | 医疗机构注册登记 | 问卷调查、电话访谈 | 3 444a | 通过A-TAC清单评估 |
| DNBC[35] | 丹麦 | 1996年至今 | 出生队列 | 会讲丹麦语言且可以参加电话采访的孕妇分娩的新生儿 | 医疗机构注册登记 | 问卷调查、电话访谈 | 100 000 | 具备病理诊断信息 |
| BBC[36] | 美国 | 1998年至今 | 出生队列 | 研究期间在波士顿医疗中心分娩的新生儿 | 医疗机构注册登记 | 问卷调查 | 7 612 | 具备电子病历诊断信息 |
| ASD亚队列(依托中国国家出生队列)[8] | 中国 | 2019年至今 | 出生队列 | 采用辅助生殖技术的家庭和自然妊娠家庭 | 医疗机构注册登记 | 问卷调查、电话访谈 | 3 125b | M-CHAT筛查阳性的儿童由医院采用标准流程进行检查和评估后明确诊断 |
| 马鞍山市出生队列[31] | 中国 | 2008年至今 | 出生队列 | 2008年10月至2010年10月在马鞍山市4家市级医疗卫生机构接受孕期保健的孕妇 | 医疗机构注册登记 | 问卷调查、电话访谈 | 5 084 | 通过量表对儿童进行SAT筛查 |
注:ABC:孤独症出生队列;MoBa:挪威母亲和儿童队列研究;SCQ:社会沟通问卷;BASIS:英国婴幼儿孤独症同胞研究中心;ALSPAC:父母和儿童埃文郡纵向研究;PLASC:年度小学生学校普查;SYC:瑞典斯德哥尔摩青年队列;DSM-Ⅳ:精神疾病诊断和统计手册第四版;ICD-10:国际疾病分类第十次修订版;Generation R:R世代研究;CATSS:瑞典儿童和青少年双生子研究;A-TAC:自闭症-抽动症、多动症和其他合并症清单;DNBC:丹麦国家出生队列;BBC:美国波士顿出生队列;M-CHAT:改良版婴幼儿孤独症筛查量表;SAT:孤独症样行为;a截至2010年的样本量,研究对象持续招募;b截至2020年9月的样本量,研究对象持续招募
本研究基于文献检索共识别出163个ASD相关队列,通过整合并归纳文献特征,既往ASD队列特征:队列建设时间主要集中在1990-2010年,以北美洲和欧洲地区为主;半数以上为出生队列,还包括ASD高危人群和专病队列;除BASIS[28]和EARLI[37]通过互联网招募队列成员外,其余队列主要利用监测系统和医疗机构注册登记等RWD,或开展社区现场调查进行招募;数据采集方式包括面对面问卷调查、访谈或电话随访等;主要通过量表和临床诊断确定ASD;研究内容覆盖ASD预前、预后,包括ASD流行特征分析、ASD危险因素和预后影响因素研究,以及ASD子代健康情况随访等。
ASD队列研究主要集中在2000-2010年开展,可能与21世纪初英国、美国ASD发病率剧增有关,且这一时期“麻腮风三联(measles-mumps-rubella,MMR)疫苗引起ASD”的说法盛行,大量相关研究应运而生,但最终未发现MMR疫苗与ASD间的关联[38, 39]。ASD队列研究集中在欧洲、美洲地区发达国家,这些国家近年来十分关注儿童精神健康问题,ASD早期筛查、针对社区需求制定或完善ASD早期干预政策等措施促进了ASD队列研究的发展[1]。ASD队列以医疗机构注册登记和健康档案监测为主,这与欧美国家重视建立疾病监测网络密不可分,例如,加拿大建立了国家ASD监测系统,该系统可从卫生健康服务或教育记录中识别患儿[40];美国CDC也建立了ASD和发育障碍监测网络,从而全面掌握国家ASD发病情况[3]。有研究表明,ASD患者的医疗服务在不同发达程度的国家间存在不平等、不均衡的现象[41],因此需要在国际研究合作的背景下建立欠发达地区的ASD相关研究并完善发育障碍儿童的服务体系,缩小不同国家间ASD患者医疗保障的差距[42]。我国已先后开展多项大型出生队列,但专注于ASD的专病队列很少,且均处于队列建设初期,存在ASD病例不足等问题,后续还应继续完善队列建设,依托大型队列构建高质量ASD亚队列。
在研究设计方面,主要通过筛查量表和临床诊断信息判断研究对象是否患有ASD,而ASD患者在发病早期易被误诊为ADHD和其他神经发育障碍疾病,由于量表使用不当和以往诊断标准不明确等原因还会造成漏诊[43]。目前ASD的临床诊断是根据一系列社会、交流和行为缺陷的严重程度进行的,主要参考精神疾病诊断和统计手册第五版(DSM-Ⅴ),已从“亚型”转向“谱系”分类,可以减少误诊的发生[1]。
在研究方向方面,随着ASD在全球的发病率不断攀升,早期的行为筛查、基因检测、环境风险因素的识别以及公众对神经发育的更好理解十分重要[44],因此大部分ASD队列研究的主要焦点一直是寻找ASD潜在的危险因素和可能的发病机制,并逐渐重视ASD患儿看护者对疾病的理解和经验[45, 46]。探究在关键时点暴露于特定环境因素的后果,ASD的遗传序列突变、染色体异常和表观遗传变化,是目前ASD研究的热点问题[45]。
现有ASD队列主要通过社区调查和医疗机构注册登记获取数据。尽管经典的社区调查和主动筛查可以获得更详细的信息、产生更准确的患病率估计值[47],但会受到研究成本、人口覆盖率、样本代表性等限制。医疗卫生服务数据和疾病监测数据等RWD为ASD队列研究提供了大样本量,但数据内容精度低、准确性差和数据格式非标准化等问题也局限了研究目的并增加了研究设计和数据处理难度,最终降低研究结果的可靠性。通过对既往ASD队列的归纳,本研究发现个别队列通过互联网招募研究对象,可节省成本,提高研究效率,方便数据采集过程中进行质控,为建立ASD研究新范式提供了思路—基于互联网患者社区开展ASD专病队列研究。
目前互联网患者社区不断形成[48, 49],利用互联网开展针对患者的观察和干预已在多个疾病领域开始兴起,一项比利时的研究表明基于互联网的干预可以减少酗酒者的酒精消费[50];在我国,已有利用“互联网+”模式进行社区慢性病管理,例如建立微信群和微信公众号收集患者健康状况并实施干预[51];利用大数据驱动的健康智能治理体系监测大学生的体质健康水平[52]。上述研究结果表明,互联网患者社区可以为目标人群提供高效、智能、精准、个性化的健康保障服务。相较于传统的社区和医院队列,基于互联网患者社区建立专病队列具备招募调查过程省时省力、研究对象配合度好且反馈迅速等优势[53];相较于基于电子病历、医保记录的真实世界研究,互联网患者社区专病队列以患者为中心,具备研究实施的灵活性、交互性、可扩展性。但同时,与经典的RWD相似,互联网患者社区数据同样侧重于获取医疗卫生服务的人群,可能存在代表性较差和低估ASD患病率等偏倚[54],且由于受制于研究对象的主观能动性并缺乏主动随访,可能导致较高的人群失访率。因此,在开展基于互联网患者社区的ASD专病队列研究时,还应考虑在队列成员中开展病例验证工作、提升数据准确性;通过主动随访等手段追踪失访人群、补全研究对象信息。
本研究利用概括性评价的方法,开展了系统性ASD队列的文献研究,全面回顾了既往ASD队列研究现状,客观梳理了既往队列设计和研究方向,深入分析了既往队列的优势与局限性,充分讨论了基于互联网患者社区构建ASD专病队列的可行性,为后续构建ASD专病队列提供科学基础。
吴昀效, 李志霞, 吕晓珍, 等. 孤独症谱系障碍队列研究进展的概括性评价[J]. 中华流行病学杂志, 2023, 44(5): 837-844. DOI: 10.3760/cma.j.cn112338-20221027-00918.
Wu YX, Li ZX, Lyu XZ, et al. Scoping review of progress in cohort studies of autism spectrum disorder[J]. Chin J Epidemiol, 2023, 44(5):837-844. DOI: 10.3760/cma.j.cn112338-20221027-00918.
所有作者声明无利益冲突





















