感染是儿童常见的疾病谱,精准、快速的病原体诊断能帮助临床医师有的放矢地进行治疗,改善患儿预后。传统的病原体诊断方法存在耗时长、灵敏度低等缺陷,近些年来二代测序技术不断发展并应用于临床,成为病原学诊断的新方法。其中宏基因二代测序技术应用最多,它可以无偏移地将标本中所有病原体的核酸都检测出来,此技术包括了样本采集、核酸提取、文库制备、高通量测序、生物信息分析和报告解读几个基本步骤。由于整个流程涉及临床、微生物、生物信息多个领域,故对于报告结果的判读需要临床医生结合患者及其他辅助诊断手段仔细斟酌反复求证。临床医生需要了解二代测序的优势和局限性,才能更好地利用这项技术服务于患者。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
感染仍是儿童目前最常见的疾病,面对一名明确感染或疑似感染的患儿,明确病灶及病原关系着整个治疗的成败和患儿的预后。常规的病原微生物检测手段存在培养时间长、阳性率低、受抗生素影响、特殊病原体检测困难等诸多缺陷,使得医生在临床实际工作中时常处于"盲打"或经验性治疗状态,如果患者的治疗效果不好,那么"大包围"现象就很常见,尤其是在有基础疾病和免疫状态差的患者,不但容易出现药物不良反应,还破坏了宿主的内环境,导致并发症增多甚至治疗失败。二代测序技术(next-generation sequencing,NGS)通过获得样本中所有核酸片段的序列信息,经过生物信息对照,能够在较短的时间内检测出所有微生物的种类,自2000年以来逐渐被应用到病原微生物的诊断中来,包括引起SARS的冠状病毒的发现[1]。2014年新英格兰医学杂志首次报告了该技术应用于脑脊液检测钩端螺旋体感染的病例[2],之后该技术被越来越多的应用到临床诊断中,然而这项技术并不能简单地用"是"或"不是"来服务临床,了解这项技术并恰当利用是目前临床医生面临的问题,本文就二代测序技术在病原学中的诊断价值进行介绍。
核酸序列测定在分子生物学研究中是一项非常重要和意义重大的技术。测序技术最早可以追溯到20世纪50年代,1977年Sanger和Coulson[3]发明的双脱氧核苷酸末端终止法和Maxam和Cilbert[4]发明的化学降解法标志着第一代测序技术的诞生,以Sanger法为代表的一代测序技术测序读长(read)可达1 000 bp,准确率高(可达99.999%),对生物学研究具有重要意义,人类基因组计划(Human Genome Project)就是基于第一代测序技术完成的。随着人类基因组计划的完成,人们开始致力于基因组功能的研究,第一代测序方法因通量低、成本高、速度慢,已经不能满足深度测序和重复测序等大规模基因组测序的需求,这促使了第二代测序,又称下一代测序的诞生,其中以Roche公司的454技术,Illumina公司的Solexa、Hiseq技术,ABI公司的SoLiD技术,Helicos公司的HeliScope技术等为典型代表[5]。二代测序的读长一般仅为几百bp,较一代测序的读长明显缩短,但通量高、周期短、成本低,不同测序平台的测序方法有所不同,在读长和准确度方面各有优劣,其中世界上使用量最大的二代测序仪是Illumina公司的Solexa和Hiseq平台,核心原理是采用边合成边测序的方法[6],其综合性价比较好,测序错误率在1.0%~1.5%,是临床常用的测序方法。
NGS因其成本低、高通量的特点,在过去的十多年里开展应用于很多探索性领域,如对新物种基因组的de novo测序、目标区域或全基因组重测序、转录组测序、宏基因组测序、表观修饰测序等[7]。其中宏基因二代测序(metagenomic next-generation sequencing,mNGS)是临床上最常见的用于病原学检测的二代测序方法,本文着重讨论mNGS在病原学诊断中的价值,不包括耐药基因、毒力检测、菌株分型及宿主免疫应答方面的探讨。
与传统的目标性病原学检测方法相比,mNGS方法就如同撒一张大网,无偏移地把标本中所有病原体的核酸(DNA或RNA)都检测出来,将可能致病的病原菌一网打尽。使用二代测序来做病原学诊断有几个基本步骤,包括样本采集、核酸提取、文库制备、高通量测序、生物信息分析和报告解读。目前除了样本采集和报告解读需要临床医生操作,其余步骤大多由实验室技术人员或测序公司操作完成。作为临床医生我们既要做好第一步和最后一步,也要了解中间的过程及其中的技术问题,这样才能读懂报告。
用于mNGS的样本可以是组织、体液、脓汁、灌洗液、分泌物等,样本量根据测序需要和核酸数量级而定,样本的稳定性对于后续的测序十分重要,尤其是RNA的测定,一般而言样本采集完应尽快进行检测以避免核酸降解,虽然冷冻时DNA和RNA能够保持完整,但冻融的过程会导致不同程度的核酸降解[8],样本采集过程中还应注意污染的问题。核酸的提取方法取决于样本的类型、新鲜程度以及提取目标(DNA、RNA),通常一个厂商会提供许多不同的提取方法。
文库建立有多种方法和试剂盒,以Illumina平台为例[9,10],对提取出来的DNA进行片段化,通过末端修复、添加A尾、接头连接和PCR富集形成文库以供后续测序。对于RNA建库常见的方法是使用随机引物进行逆转录,然后第二链合成互补DNA(cDNA),然后以与DNA类似的方式制备。
测序后的原始序列包含了大量的reads,由于大多数标本来源于人类,且人类基因组比微生物大得多(比细菌基因组大1 000倍),因此临床标本mNGS的结果通常99%以上是宿主的reads[11],通常在生物信息分析阶段会比对取出人源性核酸序列,但也有更经济的做法是在文库制备阶段就将其去除,很多方法被用于去除宿主细胞,包括使用皂素溶解选择性地溶解人体细胞,使宿主DNA含量下降,这种方法的前提是假设病原体的DNA在它的天然外壳中受到保护,这个外壳要么是细菌或真菌的细胞壁,要么是病毒的蛋白衣壳[12]。对于RNA,可以通过捕获探针杂交去除大量的人类核糖体或线粒体RNA[13],或者通过使用Cas9核酸酶选择性地靶向消除背景的人类RNA序列[14]。
生物信息分析的平台和软件有很多,测序后的数据需要与微生物数据库进行对比(细菌、真菌、病毒、寄生虫等),参考同批次阴性质控标本排除污染,根据丰度、reads数量、基因覆盖度等进行排序,根据检测阈值筛选病原菌,最终得出报告。值得注意的是,并不是所有的病原体基因组数据库都是可用的,特别是当这种微生物很罕见的时候[15],在这种情况下如果病原体序列数在标本中足够丰富,或者能够获得分离物,可以尝试重新组装[16,17]。
目前尚没有解读mNGS报告的标准方法。测序时可能引入其他来源的核酸,包括采集时引入的核酸、采集管内的核酸、来自环境的核酸和测序试剂中的核酸,由于这些检测的复杂性和潜在的广度,直接从临床标本中解释mNGS的结果可能很困难,需要仔细的解释和考虑以下因素:(1)罕见病原体或新出现的病原体株的参考数据库不完整;(2)参考数据库偏向某些生物;(3)某些必须加以区分的病原体可能在遗传学上很相似(例如分枝杆菌的种类);(4)正常菌群的存在和试剂污染等很常见,会限制结果的特异性[18,19,20]。一份好的报告结果的生成需要预先建立质量控制和结果解释的标准,这些标准可能包括对所有病例或满足定义标准的病例信息的集合或具有特殊结果病例的专家评审[21]。
文库构建时可能会引入一些污染,比如前面提到的样本采集中混有除样本外其他来源的核酸;测序深度的增加往往意味着建库时PCR扩增次数增加,会导致产生过多的重复reads使后续数据处理出现误差;而且测序本身也会有一定的错误率。质量控制并没有一个确定的标准,在质量控制过程中会去掉低质量的reads、切除质量差的碱基、去除一些长度过低的reads等,而这些处理相当于损失了一些信息。质量控制是信息量和信息准确度之间的一个平衡,所以质量控制并不是越严格越好,应根据实际情况来决定,一般来说,对基因组情况知道的越少,质量控制应该越严格。所以在开展的检测项目中,必须对测序数据进行质量评估,判断其是否达到预期的测序深度,深度不够则必须补测,若差异太大,则必须重新测序[22]。
除了排除污染的核酸,区分定植的微生物和真正致病的微生物也非常重要,尤其是细菌感染的判断。初期的mNGS是从无菌样本开始应用的,比如脑脊液和脑组织切片,但即使是"无菌"的人体样本如果进行深度的测序也可能发现非致病的微生物[23]。目前用于mNGS的测试样本已经发展到如呼吸道分泌物等不同种类,这些样本本身就含有可能的定植微生物,使得结果的分析更加复杂,故而更多的鉴别方法也随之发展开来,例如测定宿主的免疫反应来区分[24],还有文献报告通过加入外源细菌来量化绝对细菌丰度的方法[25]。目前尚无单纯基于测序结果判断致病菌、污染菌或定植菌的标准,故对于测序结果的判读需结合临床综合判断。
如上所述,mNGS目前是由临床和实验室提供的一种收费的测试,其过程混杂因素较多,不同的方法、不同的平台、不同的质控都可能影响最后结果的价值,目前尚无统一的标准流程,同时目前的价格也限制了其在临床中大规模的开展。根据现有文献的案例报道,当常规检测标准不能解释病情时,可以考虑使用mNGS,并将其作为最后的手段来试图识别感染过程;或者应用于危重或免疫功能严重受损的患者,此时及时诊断对改善预后至关重要[26]。目前已有较多报道关于mNGS技术在临床中成功诊断出病原的案例,Simner等[26]按不同系统进行了列举;Nature Reviews Genetics杂志近期发表的系统综述详细列举了mNGS在血流感染、神经系统感染、呼吸系统感染等方面的应用情况[27];我国学者也在不同领域报道了成功应用此技术诊断病原的案例[28,29,30]。
二代测序技术为病原学的诊断打开了一扇新的窗户,然而其展现给临床医生的结果是需要仔细斟酌反复求证的。感染性疾病病原诊断还是要以患者为中心,临床起主导作用,病理学、微生物学、影像学、mNGS都是帮助我们做病原学诊断,最终还是要回到患者本身。临床医生要了解二代测序的相关知识,包括其存在的优缺点及正在飞速发展的更完善的测序技术,一份好的测序结果判读是需要临床专家、微生物专家、生物信息专家等共同助力的。测序技术在飞速发展,我们有理由期待更快速、廉价、便捷、准确的测序技术将在未来应用于临床感染性疾病的诊断,让医生有的放矢,让患者最大程度受益。
利益冲突 所有作者均声明不存在利益冲突