肠道微生态专题专家笔谈
肠道微生态研究方法评价
中华消化杂志, 2018,38(11) : 754-757. DOI: 10.3760/cma.j.issn.0254-1432.2018.11.005
引用本文: 贾慧珏. 肠道微生态研究方法评价 [J] . 中华消化杂志, 2018, 38(11) : 754-757. DOI: 10.3760/cma.j.issn.0254-1432.2018.11.005.
参考文献导出:   Endnote    NoteExpress    RefWorks    NoteFirst    医学文献王
扫  描  看  全  文

正文
作者信息
基金 0  关键词  0
English Abstract
评论
阅读 0  评论  0
相关资源
引用 | 论文 | 视频

版权归中华医学会所有。

未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。

除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。

肠道菌群是人体的"另一个器官",在代谢、免疫、肿瘤等方面都起到重要作用。由于测序成本低廉且易于分析,以16S rRNA基因为代表的扩增子测序被广泛用于人体共生菌群研究。然而,只有宏基因组测序才能够无偏向性地展现某一样本中所有细菌、古菌、真菌、病毒等遗传信息,在提供比16S rRNA更为精细的微生物分类信息的同时,还可提供功能信息。随着测序成本的逐年降低,生物信息工具的发展,以及非传统病原菌功能研究的积累,宏基因组测序逐渐被用于研究人肠道菌群。在2型糖尿病研究中首创的宏基因组关联分析(metagenome-wide association study, MWAS),已经在肥胖、动脉硬化、肝硬化、结直肠癌、类风湿关节炎等多种复杂疾病的研究中取得了令人欣喜的发现[1,2]。值得注意的是,由于肠道菌群的动态特征,收取样本时控制好年龄、体质量、用药、病程等因素,是发现真正疾病信号的关键。

肠道菌群研究进入基因组学时代以来,已经逐渐超越采样信息收集不全面、样本保存运输不规范、参考基因集不完善、研究方法较简略的初级阶段,在流程和数据标准化、不同数据分析与功能注释方法开发等方面都有了长足的发展。

一、用于保存生物样本的稳定剂开发

传统粪便样本保存方式主要为低温冻存,保存和运输成本过高,不利于开展相关研究。针对现阶段肠道宏基因组学研究地域广、规模大的人群的采样需求,为能够长时间、最大限度地保持样本完整性和稳定性,降低对后续分析的影响,已经有可在常温条件下保存生物样本的稳定剂研制成功。该稳定剂可用于粪便、唾液、宫颈分泌物等样本的常温保存,并开发了配套的试剂盒。经多次实验证实,能够长时间保持样本中DNA分子的完整性和稳定性,已经广泛应用于多部位微生物组课题研究中[3]

二、参考基因集的构建与更新

健康人粪便样本中人源基因序列不足1%,为无创地研究人体肠道菌群提供了绝佳的样本。早期研究主要依赖于传统微生物培养和分子生物学技术,存在菌株信息不全、原始微生态结构改变、技术环节过多、影响因素复杂等问题。二代测序技术及其配套分析方法的发展使得宏基因组学在肠道菌群研究中的应用越来越广泛。

应用二代测序仪鸟枪法测序获取数据后,首先进行低质量数据过滤,随后通过与人参考基因组比对去除人源基因,所得数据即为高质量的肠道菌群宏基因组数据。起初,面对未知的人肠道菌群宏基因组,需要将经过处理的数据进行从头组装、拼接,难度大,耗时长。若通过收集适当样本,直接将数据以基因为单位拼接,经历注释和去冗余,积累起来构建人肠道菌群专用参考基因集,后续研究即可通过直接与参考基因集比对而获得样本的菌群组成结构,可以大大提升宏基因组学分析效率。因此,作为宏基因组学研究的基线数据,构建高质量参考基因集可对数据分析和结果产生直接影响。

2010年Nature发表的封面文章,在国际上第1次用高通量测序数据进行短序列组装、构建人体肠道菌群参考基因集、获得宏基因组样本中所有已知和未知物种基因的信息分析方法,在后续研究中被广泛应用于疾病解析、新菌种发现、宏转录组分析、宏蛋白组分析等[4]。2014年同一团队采用最新流程对全球不同饮食习惯的人种样本进行了系统组装与分析,获得的高质量参考集包含近1 000万个基因,将此基因集刷新至人体自身基因数的500倍。该参考基因集基于跨越三大洲的高质量人体肠道菌群宏基因组数据构建,对常见与罕见菌皆有覆盖,一般研究者无需对数据进行组装,直接比对参考基因集即可得到每个样本比对率>70%的良好代表性(因为仅为基因区,理论饱和值约为80%)[2,5,6]

三、宏基因组数据分析方法评价

宏基因组学数据分析过程主要包括物种组成情况分析和功能分析,在此基础上,将进一步挑选生物标志物,构建预测模型,从而获得不同样本间肠道菌群关联与异同方面的结果,以及分析环境因子对肠道菌群可能的影响。目前,随着宏基因组学研究的发展,相关的分析方法和数据库已较早期更丰富和完善,但仍然存在很多待开发的需求,这对研究人员在开展研究时针对自己的样本情况和初步分析结果调整分析策略的能力提出了较高的要求。

1.物种组成情况分析:

在物种组成方面,通常经过比对后,研究者可以利用参考基因集的注释信息获知基因对应于门、属、种等水平的相对丰度信息。肠道菌由于分离纯化培养困难,很多为未知菌种,基因和基因组信息空白较多,能够较明确给出物种注释信息的基因占比相对不足,在种水平仅为10%左右。其余大量未知、缺乏参考序列的基因仍需加以妥善利用。为了最大化地还原样本宏基因组信息,一些研究者提出可以利用在大量样本群中基因相对丰度的协同变化特征,对来自同一微生物基因组的基因进行聚簇,从而将分类水平逼近到菌株的维度,不同的研究者定义了不同的概念来解释说明这一问题。最早的宏基因组连锁群(metagenomic linkage groups, MLG)[1],以及随后出现的宏基因组簇(metagenomic clusters, MGC)[7]和宏基因组物种(metagenomic species,MGS)[8,9],均是基于这一思想。

MLG通过将人群中各自出现率和相对丰度均相近的基因聚为一类。当这些簇中的基因所能比对到的物种注释同样接近后,便可相对可信地代表来源相同的"菌株"成分。通过这种方法,可以在不需要了解每个基因真实注释信息的情况下,将其归类到最可能的物种[1]

MGS优化了聚类方法,速度更快,但是也一定程度上牺牲了准确性,一般只作为物种层面的概念而不作为菌株概念来解读。相对于仅使用已知微生物序列构建的模型,Karlsson等[7]发现使用MGS构建的模型在判别糖尿病中可以将AUC值由0.71提高到0.83。

此外,宏基因组操作分类单元法(metagenomic operational taxonomic units,mOTU)等基于单拷贝基因的方法也较为常用[10],准确性明显优于16S rRNA测序的物种分类,目前主要受限于单菌的参考基因组不全,灵敏度仍有提升空间。

结直肠癌与肠道菌群紊乱密切相关,在宏基因组学之前就发现具核梭菌(Fusobacterium nucleatum)和菌群代谢产物丁酸等在结直肠癌发生过程中起重要作用。3项几乎同时开展的MWAS独立研究均发现拟杆菌属(Bacteroides spp.)、梭菌属(Fusobacterium spp.)、微小微单胞菌(Parvimonas micra)和口炎消化链球菌(Peptostreptococcus stomatis)等肠道细菌的相对丰度在结直肠癌患者中显著高于健康人[11,12,13]。这3项独立研究除了样本来自不同国家、腺瘤患者的入组情况不同外,在物种分析上也涵盖了MLG和mOTU两种不同方法。与mOTU方法相比,MLG发现了更多在结直肠癌和对照之间具有显著差异的物种[11,12,13]

笔者团队在对类风湿关节炎的研究中首次将MWAS用于分析口腔菌群。类风湿关节炎作为一种常见的自身免疫病,在同卵双胞胎中的一致发病率为15%~30%,在异卵双胞胎中低至5%,这表明单纯遗传因素不能完全解释该疾病发生的风险[14]。在类风湿关节炎出现关节症状数年之前,便可以在体内检测到与该疾病相关的自身免疫抗体。黏膜环境,如肠道、口腔和肺部被怀疑是炎症最早发生部位[15]。对牙菌斑、唾液和粪便样本分别聚簇MLG的分析结果显示,相比于肠道菌群,类风湿关节炎患者和健康对照个体之间的差异在口腔菌群中更为明显[16,17]。这与之前建立的类风湿关节炎和牙周炎之间的流行病学联系一致[14,18]。在类风湿关节炎患者中,牙齿、唾液和粪便微生物的成分或功能相对于健康人的改变存在部分重叠,并且可以观察到特定细菌类群与类风湿关节炎的血清标志物水平相关[17]。同一个人不同部位的MLG之间存在明显的正相关或负相关,尤其唾液乳杆菌(Lactobacillus salivarius)在唾液、牙菌斑、粪便中一致,体现了MLG在菌株水平的分析精度[17]

2.功能分析:

在功能注释方面,传统的生物信息学数据库"京都基因与基因组百科全书"(Kyoto encyclopedia of genes and genomes,KEGG)一直是包括宏基因组学在内的各种组学研究都会首先选择比对的常规数据库之一。研究人员根据不同的目的需求和数据情况,常同时选择其他功能数据库包括基因本体(gene ontology)、蛋白质直系同源簇(clusters of orthologous groups of proteins)等进行比对分析。针对肠道菌群,近年来已经逐渐发展起诸如基因进化谱系(evolutionary genealogy of genes: non-supervised orthologous groups,eggNOG)和肠道代谢模块(gut metabolic modules,GMM)等专为菌群或者肠道菌群研究设计的功能模块,也很值得推荐。

结直肠癌患者菌群研究发现,与健康人相比,结直肠癌患者肠道菌群代谢糖类和食物纤维的能力降低,但是代谢氨基酸和宿主糖的能力则较好,并且其很可能参与产生毒素和致癌代谢物[11,12,13]。蔬果、肉类摄入等流行病学研究中已知的结直肠癌保护或风险因素都在肠道菌群数据中得到了体现。在类风湿关节炎研究中,患者与健康人在铁、硫、锌、精氨酸等代谢通路上的差异也符合预期[17]。在婴儿、结直肠癌、冠状动脉粥样硬化性心脏病等研究中还都用到了功能通路检验方法(reporter score)来发现功能模块(module)或通路(pathway)的显著富集[13,19,20]。例如,4月龄的婴儿肠道菌群合成γ-氨基丁酸的能力显著高于新生儿,而1周岁婴儿在色氨酸至血清素(serotonin)、褪黑素(melatonin)的通路功能明显强于4月龄儿和新生儿[19]

3.预测模型构建:

基于肠道菌群的疾病筛查是国内外的研究热点,而筛查的准确性取决于构建的预测模型是否合适。预测模型是基于不同样本间物种组成情况、功能间的分析结果,在宏基因组数据上使用随机森林(random forest)、最小绝对收缩与选择算子(least absolute shrinkage and selection operator,LASSO)等统计算法选取疾病与健康人群的标志性菌群基因或物种作为生物标志物,然后以这些生物标志物为基础构建完成的数学模型。这种预测模型在糖尿病、结直肠癌等疾病的研究中都达到了良好的特异度和灵敏度[2]

糖尿病研究中曾采用的最小冗余最大相关性特征选择方法(minimum redundancy maximum relevance,mRMR)已经逐渐被延展性更好的随机森林方法所取代[2]。在类风湿关节炎的研究中,随机森林模型还被用于从患者治疗前的菌群MLG组成预测抗风湿药物(disease-modifying anti-rheumatic drugs,DMARD)治疗后的疗效,为精准治疗提供依据[17]。使用LASSO需注意过拟合问题,用于异质性高的样本分析时难以发现信号[21],尤其需要真正独立采集的验证数据。

四、小结与展望

人体共生微生物MWAS研究的最终目标是精准医疗,可以预见随着该领域研究的深入和不断发展,其在个人饮食、生活习惯,乃至早期诊断、用药指导、治疗与预防疾病等方面将会有越来越多的作用。然而,此终极目标的实现需要建立在对共生微生物更加详细的了解与定义的基础上,而且对于不同的个体,健康的共生微生物定义可能有很大差异。为此,不论是针对健康人还是患者,都需要更大规模、更深入的研究。对人体共生微生物的了解更加全面之后,可以预见,在取样、测序、物种分析、功能分析和预测模型构建等方面均将取得全面进步与完善,终将促使宏基因组学关联分析研究为人类健康和疾病管理带来广泛且深远的影响。

参考文献
[1]
QinJ, LiY, CaiZ, et al. A metagenome-wide association study of gut microbiota in type 2 diabetes[J]. Nature, 2012, 490(7418): 55-60. DOI: 10.1038/nature11450.
[2]
WangJ, JiaH. Metagenome-wide association studies: fine-mining the microbiome[J]. Nat RevMicrobiol, 2016, 14(8): 508-522. DOI: 10.1038/nrmicro.2016.83.
[3]
HanM, HaoL, LinY, et al. A novel affordable reagent for room temperature storage and transport of fecal samples for metagenomic analyses[J]. Microbiome, 2018, 6(1): 43. DOI: 10.1186/s40168-018-0429-0.
[4]
QinJ, LiR, RaesJ, et al. A human gut microbial gene catalogue established by metagenomic sequencing[J]. Nature, 2010, 464(7285): 59-65. DOI: 10.1038/nature08821.
[5]
LiJ, JiaH, CaiX, et al. An integrated catalog of reference genes in the human gut microbiome[J]. Nat Biotechnol, 2014, 32(8): 834-841. DOI: 10.1038/nbt.2942.
[6]
XieH, GuoR, ZhongH, et al. Shotgun metagenomics of 250 adult twins reveals genetic and environmental impacts on the gut microbiome[J]. Cell Syst, 2016, 3(6): 572-584. DOI: 10.1016/j.cels.2016.10.004.
[7]
KarlssonFH, TremaroliV, NookaewI, et al. Gut metagenome in European women with normal, impaired and diabetic glucose control[J]. Nature, 2013, 498(7452): 99-103. DOI: 10.1038/nature12198.
[8]
Le ChatelierE, NielsenT, QinJ, et al. Richness of human gut microbiome correlates with metabolic markers[J]. Nature, 2013, 500(7464): 541-546. DOI: 10.1038/nature12506.
[9]
NielsenHB, AlmeidaM, JunckerAS, et al. Identification and assembly of genomes and genetic elements in complex metagenomic samples without using reference genomes[J]. Nat Biotechnol, 2014, 32(8): 822-828. DOI: 10.1038/nbt.2939.
[10]
SunagawaS, MendeDR, ZellerG, et al. Metagenomic species profiling using universal phylogenetic marker genes[J]. Nat Methods, 2013, 10(12): 1196-1199. DOI: 10.1038/nmeth.2693.
[11]
ZellerG, TapJ, VoigtAY, et al. Potential of fecal microbiota for early-stage detection of colorectal cancer[J]. Mol Syst Biol, 2014, 10: 766. DOI: 10.15252/msb.20145645.
[12]
FengQ, LiangS, JiaH, et al. Gut microbiome development along the colorectal adenoma-carcinoma sequence[J]. Nat Commun, 2015, 6: 6528. DOI: 10.1038/ncomms7528.
[13]
YuJ, FengQ, WongSH, et al.Metagenomic analysis of faecal microbiome as a tool towards targeted non-invasive biomarkers for colorectal cancer[J]. Gut, 2017, 66(1): 70-78. DOI: 10.1136/gutjnl-2015-309800.
[14]
McInnesIB, SchettG. The pathogenesis of rheumatoid arthritis[J]. N Engl J Med, 2011, 365(23): 2205-2219. DOI: 10.1056/NEJMra1004965.
[15]
DemoruelleMK, DeaneKD, HolersVM. When and where does inflammation begin in rheumatoid arthritis?[J]. Curr Opin Rheumatol, 2014, 26(1): 64-71. DOI: 10.1097/bor.0000000000000017.
[16]
ScherJU, SczesnakA, LongmanRS, et al. Expansion of intestinal Prevotella copri correlates with enhanced susceptibility to arthritis[J]. Elife, 2013, 2: e01202. DOI: 10.7554/eLife.01202.
[17]
ZhangX, ZhangD, JiaH, et al. The oral and gut microbiomes are perturbed in rheumatoid arthritis and partly normalized after treatment[J]. Nat Med, 2015, 21(8): 895-905. DOI: 10.1038/nm.3914.
[18]
ScherJU, UbedaC, EquindaM, et al. Periodontal disease and the oral microbiota in new-onset rheumatoid arthritis[J]. Arthritis Rheum, 2012, 64(10): 3083-3094. DOI: 10.1002/art.34539.
[19]
BäckhedF, RoswallJ, PengY, et al. Dynamics and stabilization of the human gut microbiome during the first year of life[J]. Cell Host Microbe, 2015, 17(5): 690-703. DOI: 10.1016/j.chom.2015.04.004.
[20]
JieZY, XiaHH, ZhongSL, et al. The gut microbiome in atherosclerotic cardiovascular disease[J]. Nat Commun, 2017, 8(1): 845. DOI: 10.1038/s41467-017-00900-1.
[21]
ForslundK, HildebrandF, NielsenT, et al. Disentangling type 2 diabetes and metformin treatment signatures in the human gut microbiota[J]. Nature, 2015, 528(7581): 262-266. DOI: 10.1038/nature15766.
 
 
展开/关闭提纲
查看图表详情
回到顶部
放大字体
缩小字体
标签
关键词