
A族链球菌(GAS)是造成全球儿童死亡的重要病原之一。细菌分型是研究病原微生物流行特征最常用的手段,emm分型是研究GAS常用的分型方法。近些年新提出的emm簇分组系统是基于M蛋白氨基酸序列同源性和与宿主血清蛋白结合能力进行分型,在国外已被广泛用于流行病学调查、菌株选择及疫苗开发等,但在国内目前尚未被应用。emm分型是基于emm基因的一个小的可变区域,而emm簇分组系统根据emm基因的几乎完整序列定义GAS类型,且emm簇分组系统可直接由emm分型比对获得,简单易行。因此,emm簇分组系统可提供有关GAS不同emm型中M蛋白的功能和结构特性的更多信息,现就emm簇分组系统的方法、原理及目前在GAS相关研究中的应用等作一综述,以便于在国内推广应用。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
A族链球菌(GAS),又称酿脓链球菌或化脓性链球菌,为一种β溶血性链球菌,可引起人类咽炎、扁桃体炎、脓疱病等浅表皮肤感染,还可引起坏死性筋膜炎、链球菌中毒性休克综合征等严重侵袭性感染,反复GAS感染可导致肾小球肾炎、风湿热和风湿性心脏病等自身免疫性疾病[1]。据报道,GAS每年可在全球造成7亿多例新感染[2]、50万人死亡[3]。基于M蛋白可变的N端部分,目前已鉴定出240多种不同的emm型,这增加了流行病学研究的复杂性[1]。近年,一种新的emm簇分组系统在国外逐渐被应用,该分型系统将特定的emm型别归集为一簇,本文就这种emm簇分组系统的分型原理、方法及其在GAS疾病研究中的应用作一综述,以便在国内GAS研究中推广使用。
GAS分型方法包括血清学分型、分子生物学分型及基因分型。M分型是传统的血清分型方法,但M血清制备困难及M蛋白抗原存在变异,使其应用受到极大限制,GAS的分子分型依赖于编码一种称为M蛋白的表面蛋白的基因序列,也是目前广泛使用的分型方法。GAS的致病性通常与特定GAS菌株编码的多种毒力因子的产生有关,如黏附素、毒素、蛋白酶、DNA酶及超抗原等[3],其中M蛋白是GAS最重要的毒力因子,M蛋白可诱导产生抗体,并使细菌在无抗体的情况下可抑制吞噬,使其成为主要的候选疫苗抗原[4]。
以编码成熟M蛋白基因N端高度可变的核苷酸和氨基酸序列为基础的寡核苷酸探针对GAS进行emm分型是目前最常用的分型方法[5]。目前已有240多种不同的emm型被报道[6],emm分型也被广泛运用于各个国家GAS流行病学研究[7,8,9,10]。全球大量的GAS emm型别监测研究表明,由于不同地域间的临床疾病构成不同,以及地域性持续流行的GAS存在,GAS的emm型别分布有明显的地域差异,各个国家均不存在单一主导型[11]。
GAS菌株emm型别的多样性、流行概况等在各国之间的差异性,导致预测特定emm型疫苗的覆盖率较低,阻碍了疫苗的开发[12]。20世纪50年代的研究表明,同种型别菌株特异性抗体的存在证实了相同emm型别存在特异性免疫,这些研究中测试的菌株对异源GAS型的感染没有影响[13]。然而,一些证据表明,类型特异性范例可能不能直接适用于在低收入国家或地区流通的许多菌株。一项关于30价疫苗的临床前研究已经证明,疫苗能对表达M蛋白的菌株分离物产生体外交叉保护作用[14]。根据M蛋白完整序列的预测数据,这种交叉保护现象的假设逐渐被提出[15]。近些年提出的emm簇分组系统,将许多GAS的emm型分为离散的emm簇,其中包含密切相关的M蛋白,它们具有共同的结合和结构特性,这个emm簇分组系统可以预测M蛋白疫苗抗原的特征,并作为一个框架来研究交叉保护现象。重要的是,emm簇分组系统与类型特异性抗体并不矛盾,是对来自低收入环境的许多细菌变体提出的一个补充假说。
2014年,Sanderson-Smith等[16]进行了一项来自31个国家、175个emm型的1 086株GAS分离株的全球综合研究,对完整的M蛋白序列进行同源性分析并构建系统发育树,经过选择压力和M蛋白与6种宿主血清蛋白(IgG、IgA、C4结合蛋白、纤维蛋白原、纤溶酶原和白蛋白)结合能力的分析,提出了emm簇分组系统。该分型系统将emm型分为48个离散的emm簇(E1~E6、D1~D5、A-C1~A-C5和32个单个M蛋白组成的emm簇)。emm簇分组系统[16]基于M蛋白全序列同源性及功能特性进行分组,根据同源序列、共同的结构特征和相似的结合能力,将多个emm型归集为emm簇,作为一种补充的分子分型方法,在国外被广泛应用于流行病学研究、菌株变异研究及疫苗设计与评价,但该分型系统在国内尚未被广泛应用。
emm簇分组系统主要根据M蛋白全序列同源性和功能特性将菌株进行分型。核苷酸蛋白序列分析用Seaview(高精度高通量多序列比对的计算机软件)中的默认参数,使用MUSIC(用于序列比对和系统发育树构建的软件)获得多个蛋白质序列比对。使用BMGE(从多序列比对中选择系统发育信息区的软件)的默认标准从这些比对中提取信息性位点,在优化的BIONJ起始树的Lg+Γ替代模型下,用PhyML(计算系统发育最大似然比的算法软件)进行系统发育推论。emm簇的定义基于4个生物信息学标准:(1)单系或副系性质;(2)由近似似然比检验(ALRT)>80%支持;(3)所有M蛋白之间的最小平均配对同源性为70%;(4)M蛋白对之间的最小配对同源性为60%(重复大小变异不包括在同一性计算中)。在系统发育树构建后进行选择性压力分析。基于以上,通过对175种emm型中的每一种选择1个具有代表性的序列进行系统发育分析,得到系统发育树,定义了2个主要分支(X 、Y),Y分支分为2个主要亚支(Y1和Y2),分支X、亚支Y1和亚支Y2进一步细分为48个emm簇。
此外,M蛋白具有多种功能,通常通过与人类宿主产物(如纤维蛋白原、H因子、白蛋白、IgA和IgG、纤溶酶原等)结合,在防止吞噬、介导与宿主细胞的黏附和细胞内侵袭方面发挥作用,许多宿主蛋白与M蛋白中不同的区域或结构域结合[17]。emm簇分组系统将26种代表性M蛋白的功能与6种最重要的宿主配体联系起来。根据特定的结合特性,对119种M蛋白进行功能预测,得到emm簇功能特性模型,并证实emm簇分组系统与119个M蛋白质的精细结合基本一致。因此,emm簇分组可能具有生物学相关性,并可能为M蛋白功能的临床相关方面提供见解。
emm簇分组可由emm分型结果得出,根据美国疾病控制和预防中心提供的emm分型方案(http://www.cdc.gov /streplab/protocol-emm-type.html)进行聚合酶链式反应扩增、测序。为鉴定临床分离株的emm簇分组型别,将emm基因的核苷酸序列提交到BLAST 2.0服务器(国家疾病控制中心,生物技术核心设施计算实验室,http://www2a.cdc.gov/ncidod/biotech/strepblast.asp)上的GAS分型请求,将未知类型序列与本服务器数据库中的参考emm型序列进行对齐,确定emm簇类型(表1)。

emm分型与emm簇分组[16]
emm typing and emm cluster typing
emm分型与emm簇分组[16]
emm typing and emm cluster typing
| emm簇 | emm分型 | |
|---|---|---|
| X分支 | E1 | 4-60-78-165 -176 |
| E2 | 13-27-50(50/62)-66-68-76-90-92-96-104-106-110-117-166-168 | |
| E3 | 9-15-25-44(44/61)-49-58-79-82-87-103-107-113-118-144-180-183-209-219-231 | |
| E4 | 2-8-22-28-73-77-84-88-89-102-109-112-114-124-169-175- 232 | |
| E5 | 34-51-134-137-170-174-205 | |
| E6 | 11-42-48-59-63-65(65/69)-67-75-81-85-94-99-139-158-172-177-182-191 | |
| X分支独立蛋白簇 | 164-185-211-236 | |
| Y分支 | D1 | 36-54-207 |
| D2 | 32-71-100-115-213 | |
| D3 | 123-217 | |
| D4 | 33-41-43-52-53-56-56.2-64-70-72-80-83-86-91-93-98-101-108-116-119-120-121-178-186-192-194-208-223-224-225-230-242 | |
| D5 | 97-157-184 | |
| A-C1 | 46-142 | |
| A-C2 | 30-197 | |
| A-C3 | 1-163-227-238(1-2)-239(1-4) | |
| A-C4 | 12-39-193-228-229 | |
| A-C5 | 3-31-133 | |
| Y分支独立蛋白簇 | 5-6-1417-18-19-23-24-26-29-37-38(38/40)-47-55-57-74-95-105-111-122-140-179-215-218-221-222-233-234 |
emm簇分组系统自2014年被提出以来,在国外已被广泛应用[18],尤其用于GAS流行病学分析及疫苗抗原分析[17,19,20,21]。抗原表达的序列变异对宿主免疫应答起调节作用,emm簇分组系统的应用提供了一种辅助疫苗抗原选择和开发的工具PopPUNK[22],使用现有的生物信息学平台来评估所选择的任何候选疫苗的GAS基因组序列中的抗原变异,是解决当前GAS多样性的重要一步。
多种毒力因子的参与导致了GAS复杂的致病性[23],评估毒力基因谱与疾病的关系是链球菌研究中必不可少的一部分。emm簇分组系统反映了M蛋白与宿主蛋白的结合能力,这种结合宿主配体的能力与毒力因子的毒力潜力有关。Gergova等[24]等利用emm簇分组系统回顾性分析了2014年至2018年保加利亚临床链球菌分离株的emm基因型,并评估emm簇与毒力基因谱和疾病类型的关系,得出当地主要流行簇A-C3簇拥有许多链球菌热原性外毒素的基因,这些外毒素为超级抗原,并具有潜在的更高毒性。因此,利用emm簇分组系统进行毒力基因谱的分析将有利于检测出当地GAS所携带的高毒力基因,可更好地监测高致病性GAS菌株。
M蛋白是一种免疫原性蛋白,能诱导产生保护性抗体,使毒株分化为不同的emm型,疫苗开发的一个主要障碍就在于此[25]。即感染后的免疫仅限于一种emm型。然而,emm簇的提出可为不同emm型间交叉免疫反应的假说提供依据[18]。一项研究分析了学龄期儿童GAS脓疱病血清学反应的3个主要emm簇(E4、E6和D4),用含N-末端M肽的酶联免疫吸附试验分析感染前后的血清,用感染型菌株、emm簇相关菌株和非相关菌株进行杀菌试验,结果显示皮肤感染后会发生M型特异性和交叉反应性免疫反应,且交叉免疫反应通常与emm簇一致[14]。交叉保护免疫可极大地帮助候选疫苗对抗多种类型的菌株[26]。该研究提示,emm簇分组系统的应用有望为设计覆盖面广的多价疫苗提供新机会。
疫苗进展受到阻碍,还有部分原因是缺乏适用于疫苗评估的标准化功能检测,emm簇分组系统被应用于疫苗开发功能检测[27],可为加速GAS疫苗的开发提供一个强大且可重复性的平台。开发具有广泛保护性的基于M蛋白的GAS疫苗,一个主要障碍即为引起有效杀菌抗体的N末端表位的可变性。应用emm簇分组系统,结合基于计算结构的肽模型,为设计具有广泛保护作用的M蛋白疫苗提供了新方法。Dale等[4]使用三维结构预测工具分析了包含17种emm型GAS的E4簇的M蛋白序列,确定最能代表簇中M肽的三维物理化学性质的序列,5种肽被用于配制重组疫苗,通过酶联免疫吸附试验检测兔抗血清中与E4肽和全菌交叉反应的抗体,以及针对所有E4簇GAS的杀菌活性,发现含有相同E4肽的重组杂交疫苗也能诱导抗体与所有E4肽发生交叉反应,得出使用基于结构设计的综合研究可能会产生广泛保护性的M肽疫苗,该疫苗将针对大多数临床相关emm型产生GAS簇特异性抗体反应。
另外一项基于emm簇分组系统疫苗评价的研究提示,虽然交叉免疫作用有可能提高疫苗的覆盖率,但超过1/3的皮肤分离株未进行交叉免疫;emm簇D变异体,特别是emm簇D4,与其他emm簇相比,交叉免疫阳性的可能性较小[28]。因此,提高疫苗效力可能既需要交叉保护,也需要额外的措施来诱导对特殊emm簇变异的免疫力。
GAS分型与疾病表现存在关联,需定期更新流行病学特征来跟踪GAS的多方面致病潜力,emm簇分组系统可用于GAS相关流行病学研究。Grivea等[19]使用emm簇分组系统研究太平洋地区分离菌株的流行趋势及耐药性,得出7个最常见的emm簇,占这项研究中emm型分离株的98.5%,提示emm簇分组系统可用于流行病学分析,指导疫苗开发。Shulman等[29]使用emm簇分组系统分析了北美分离的菌株,并建议这种分型系统可为GAS疫苗的开发提供更多信息。因此,emm簇分组系统应用于GAS相关流行病学研究不仅是一种简单可行的方法,也将有望通过功能特性分析M蛋白与疾病的关联,从而探讨GAS导致疾病的发病机制。
emm簇分组系统是基于M蛋白全序列同源性和功能特性分型的,已被证明可提供有关M蛋白功能和结构特性的其他信息,且可能是鉴定疫苗抗原的有用工具。将其作为GAS分型方法的实施将有助于未来对M蛋白功能的解释、链球菌毒力研究、流行病学监测以及疫苗设计和评价提供支持。当然,emm簇分组系统并不会取代emm分型,但可作为一种新的补充工具,其增加了额外有意义的生物学信息,可用于GAS分子流行病学分析。针对其他细菌的疫苗经验,如肺炎链球菌,研究表明疫苗的引入可能会导致血清型替换和新的菌株出现[30]。emm簇分组系统提供了一种工具来预测这种风险,并监测在引入任何疫苗后可能发生的流行病学变化。未来关于证明交叉保护学说的实验可能会改进目前的emm簇分组系统,从而为确定抗原新颖性提供直接价值。
所有作者均声明不存在利益冲突





















