通过构建扩张型心肌病患者外周血浆的mRNA差异性表达谱,并对差异表达的mRNA进行功能分析,为阐明扩张型心肌病的发生发展机制提供依据。
应用转录组测序技术(RNA-seq)构建扩张型心肌病组(6例)和正常对照组(9例)的mRNA表达文库,获得基因水平的mRNA FPKM值,作为mRNA的表达谱,计算两组样品间差异并获得差异mRNA表达谱,利用差异mRNA进行基因本体(GO)功能分析和京都基因与基因组百科全书(KEGG)通路分析,进一步研究差异mRNA的功能。随机挑选3个显著上调和3个显著下调的差异表达mRNA,选取10例扩张型心肌病患者和10例健康对照,进行定量即时聚合酶链锁反应验证。
共筛选出1 418条差异表达的mRNA,其中上调的有800条,下调的有618条,通过GO和KEGG生物学功能分析,发现差异性表达的mRNA参与到能量代谢、肌肉组织器官发育、细胞离子稳态失衡等生物学过程,显著富集在Wnt信号通路,并进一步筛选出可能与扩张型心肌病有关的目标基因GSK3β和SFRP2。应用定量即时聚合酶链锁反应在扩大样本中进行验证,结果差异均有显著统计学意义(P<0.05或P<0.01)。
本研究应用RNA-seq技术获得扩张型心肌病mRNA差异性表达谱,筛选出可能与扩张型心肌病有关的目标基因,为进一步研究扩张型心肌病的发病机制和药物治疗靶点提供依据。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
扩张型心肌病(dilated cardiomyopathy, DCM)是临床上常见的原发性心肌病[1]。DCM预后差,目前病因及发病机制尚不明确。近年来,随着DNA测序技术的发展,发现在人类基因组中蛋白质编码基因小于3%[2]。可以说,在个体内决定细胞类型的不是基因本身而是基因表达模式,基因表达存在时空特异性,细胞的基因表达谱即基因表达的种类和强度,在体内受到精细控制。近年的研究显示,DCM具有差异的非编码RNA表达谱[3]。转录组测序技术(RNA-sequence,RNA-seq)是新一代转录组测序技术,现已成为全转录组研究中不可或缺的强大研究平台,RNA-seq技术已被广泛应用于多种人类复杂疾病、恶性肿瘤、免疫疾病等疾病的研究,对于寻找生物标志物、探寻发病机制、制定靶向治疗方案有着重要意义[4]。
本研究应用RNA-seq技术检测DCM患者及正常人群外周血浆mRNA表达谱,为研究DCM的发生发展及寻找新的生物标记和治疗靶点提供依据。
随机选取在聊城市人民医院确诊为DCM的患者6例,其中男性5例、女性1例,并于同期在聊城市人民医院体检的健康人群中选择9例作为正常对照组,正常对照组年龄、性别与DCM组相一致。所有DCM患者均符合2006年世界卫生组织和国际心脏病联合会(WHO/ISFC)工作组制定的标准[5]:(1)左心室舒张末期内径(left ventricular end diastolic diameter,LVEDD)>50 mm(女性)或55 mm(男性)。(2)左心室射血分数(left ventricular ejection fraction,LVEF)<45%和/或左心室射血分数缩短<25%。(3)排除冠心病、高血压、心脏瓣膜病、先天性心脏病、酒精性心肌病、心动过速性心肌病、围生期性心肌病和糖尿病导致的心脏扩大或心力衰竭。DCM组和对照组临床资料见表1。本研究获聊城市人民医院伦理委员会批准同意。
项目 | DCM组(6例) | 正常对照组(9例) |
---|---|---|
年龄(岁) | 44.67±13.40 | 44.22±11.81 |
收缩压(mmHg) | 115.33±15.42 | 118.89±5.21 |
舒张压(mmHg) | 80.0±7.16 | 75.22±4.12 |
心率(次/min) | 89.33±13.65 | 71.0±4.66 |
LVEDD(mm) | 68.0±10.10 | 44.33±1.80b |
LVEF(%) | 28.17±7.68 | 68.22±4.58b |
NT-proBNP(pg/ml) | 3 855.0±1 960.47 | 81.67±11.0b |
血红蛋白(g/L) | 141.67±15.58 | 133.0±6.65 |
白细胞(×109/L) | 8.04±1.00 | 6.78±0.63b |
血谷丙转氨酶(IU/L) | 73.17±46.48 | 27.89±5.62a |
血谷草转氨酶(IU/L) | 45.5±15.49 | 26.67±5.55a |
血肌酐(μmol/L) | 71.67±14.79 | 51.78±6.74b |
总胆固醇(mmol/L) | 3.69±0.52 | 4.77±0.43b |
注:DCM:扩张型心肌病,LVEDD:左心室舒张末期内径,LVEF:左心室射血分数,NT-proBNP:N末端B型利钠肽前体;与DCM组比较,aP<0.05,bP<0.01
主要试剂:TRIZOL试剂(Invitrogen life technologies公司),DEPC-TREATED WATER(Invitrogen life technologies公司),RNA酶抑制剂(Epicentre公司),SuperScript™ III Reverse Transcriptase(Invitrogen公司),5× RT缓冲液(Invitrogen公司),2.5 mmol/L dNTP混合液(HyTest Ltd公司)。主要仪器:NanoDrop ND-2000仪(Thermo Fisher Scientific公司), Ribo-Zero rRNA Removal Kits(Illumina公司),TruSeq Stranded Total RNA Library Prep Kit(Illumina公司),BioAnalyzer 2100仪器(Agilent Technologies公司),Illumina HiSeq4000(Illumina公司)。
受试者空腹12 h,晨起后于肘静脉取血,用防凝负压管分别采集DCM组和正常对照组外周静脉血5 ml,离心机分离出血浆,- 80 ℃冻存。
从-80 ℃冰箱中取出血浆样品,解冻后离心去除杂质,取250 μl血浆转至1.5 ml的离心管中,加入750 μl TRIZOL试剂和20 μl冰醋酸,振荡管体至混匀。匀浆后样品于15~30 ℃孵育5 min,加入0.2 ml的氯仿,剧烈振荡管体15 s,30 ℃孵育2 min。4 ℃ 12 000×g离心15 min,离心后混合液体分层,RNA全部被分配于无色水相中。取上层水相移入另一离心管,加入0.5 ml异丙醇,混匀后室温静置10 min,4 ℃ 12 000×g离心,10 min后可见管底及侧壁上附着RNA胶状沉淀。移去上层液体,加入1 ml 75%乙醇清洗附着于管壁的胶状沉淀物,充分振荡,4 ℃ 7 500×g离心5 min。去除上层液体,沉淀物静置至不完全干燥,约5~10 min,加入无RNA酶水溶解RNA,55~60 ℃孵育10 min。获得的RNA溶液保存于-80 ℃。
使用Ribo-Zero rRNA Removal Kits(Illumina,美国)移除总RNA中的rRNAs,使用TruSeq Stranded Total RNA Library Prep Kit预处理RNA,构建测序文库。使用BioAnalyzer 2100仪器进行文库质控和定量。根据Illumina测序说明,将10 pmol/L文库变性为单链DNA分子,在Illumina flowcell上捕获,原位扩增为簇(cluster),并在Illumina HiSeq测序仪上进行150 cycle测序。
经过Illumina HiSeq4000测序仪测序,获得原始数据。首先使用Q30值进行原始数据质控。使用cutadapt软件(v1.9.3)去接头,去低质量reads,使用hisat2软件(v2.0.4)在Ensembl gtf基因注释文件指导下,将高质量去接头reads比对到人的参考基因组(UCSC HG19)上。使用cuffdiff软件(v2.2.1)获得基因水平的mRNA FPKM(Fragments Per Kilobase of transcript per Million fragments mapped)值,作为mRNA的表达谱。使用Agilent Gene Spring软件进行数据分析,标准化处理获得两组fold change值及差异mRNA表达谱,标准为两组fold change变化2倍以上且P<0. 05。应用Gene Spring Software 11.0软件对差异表达的mRNA做聚类分析。对差异mRNA进行基因本体(gene ontology, GO)功能分析和京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomes, KEGG)通路分析,P<0.05的条目被认为有显著统计学差异。
选取年龄匹配的10例DCM患者和10例健康对照组,随机挑选3个显著上调和3个显著下调的差异表达mRNA进行qRT-PCR验证。应用TRIZOL试剂提取DCM患者和健康对照组血浆RNA,制备cDNA文库,应用2X PCR master mix(CloudSeq)进行验证。各样品的目标RNA和内参(实验样品以ACTB为内参,以正常对照组-1为基准)分别进行qRT-PCR反应。数据采用2-ΔΔCT法进行分析。
使用NanoDrop ND-2000仪测量每个样品的RNA浓度,以OD260/OD280值作为RNA纯度指标,该实验标本OD260/OD280值范围在1.8 ~ 2.1,即RNA纯度合格。
应用RNA-seq技术,获得DCM组和对照组的mRNA表达谱,通过数据分析,发现mRNA在DCM患者与对照组血浆中的表达存在明显差异,共发现1 418条差异表达的mRNA (差异倍数>2,且P<0. 05) ,其中表达上调的800条,下调的有618条。对差异表达的mRNA进行聚类分析图显示,可直观的看到DCM组和正常组mRNA的表达差异,同组样本聚在一起,说明样本间基因表达趋势一致(图1)。
为了阐明差异表达基因在DCM参与的生物学过程和分子机制,进一步对差异表达基因进行了功能和通路富集分析。功能和通路的富集分析采用DAVID (database for annotation, visualization and integrated discovery)在线工具进行[6],该工具基于GO和KEGG数据库。GO分析是用以注释基因、基因产物、序列的生物学基因库,分为3个部分:分子功能(molecular function,MF)、生物过程(biological process,BP)和细胞组分(cell component,CC)。我们对差异表达的mRNA进行GO功能分析,以注释并推测这些mRNA的功能,GO分析显示,差异表达的mRNA参与下调质子转运双区ATP酶复合体、肌球蛋白重链(myosin heavy chain,MHC)蛋白复合物结合、作用于NAD(P)H的氧化还原酶活性,上调肌肉组织器官发育的正调控、细胞离子稳态失衡等生物学过程(图2)。KEGG通路分析是将基因组学、转录组学、蛋白质组学和代谢组学中的分子数据集映射到KEGG通路图上,以进行生物学功能解释,KEGG通路分析显示差异表达的mRNA显著富集在Wnt信号通路。在Wnt信号通路中涉及到11个差异基因,分别是CCND2//CER1//CHD8//DAAM1//FZD5//FZD9//GSK3β//MAPK8//SFRP2//WNT1//WNT5B,GSK3β及SFRP2在DCM组和正常对照组中的差异性最大,二者均在DCM组中表达明显下调。
在显著上调的mRNA和显著下调的mRNA中各随机选取3条(上调:OR5M1,SIK3,MTAP;下调:OR6S1,ADGRG1,TBC1D8),在10例DCM患者和10例健康对照中进行qRT-PCR验证。结果在扩大样本中,PCR结果与RNA-seq结果基本一致(图3)。
DCM是导致心力衰竭的常见心肌病,我们前期对DCM的病因及影响因素做了流行病学研究,发现DCM组血清铁、铜、锰、钙浓度均明显高于对照组,推测这些元素升高与DCM发病存在联系[7]。随着人类基因图谱的日益完善和后基因组研究的进展,目前已发现超过100个基因突变与心肌病有关[8]。与基因芯片技术相比,RNA-seq可进行全基因组水平的基因表达差异研究,具有定量更准确、可重复性更高、检测范围更广、分析更可靠等特点,其利用高通量测序技术对组织或细胞中所有RNA反转录而成的cDNA文库进行测序,通过统计相关读段数计算出不同RNA的表达量,可确定转录本位置、剪切情况等更为全面的遗传信息,而非基因芯片那样仅能提供间接的模拟的信号[9]。
本研究通过RNA-seq技术获得DCM基因差异性表达谱,结果表明,与正常对照组相比,DCM组有1 418条mRNA存在差异性表达,其中上调的有800条,下调的有618条,这些基因的差异性表达可能导致了DCM的发生。为了进一步研究差异性表达基因参与的生物学功能,我们将差异性表达的mRNA进行GO分析和KEGG通路分析。GO结果表明,差异表达的mRNA参与下调质子转运双区ATP酶复合体、作用于NAD(P)H的氧化还原酶活性、MHC蛋白复合物结合,上调肌肉组织器官发育的正调控、细胞离子稳态失衡等生物学过程,表明DCM在能量代谢、心肌发育、细胞离子稳态失衡等方面与正常人相比有显著差别,值得注意的是,差异性表达的mRNA在MHC蛋白复合物结合过程显著下调,MHC和心肌肌动蛋白的头域之间的相互作用提供心脏肌肉收缩所需的机械力,DCM患者MHC蛋白复合物结合过程显著下调,导致肌节收缩过程机械力产生障碍。KEGG通路分析显示,差异表达的mRNA在Wnt通路显著富集。新的证据表明,Wnt通路在调节心脏血管发育及心肌肥大过程中起关键作用[10]。Wnt通路在心脏发育期间特别活跃,在正常成年哺乳动物心脏中,Wnt信号是静止的,但在心脏病理过程中Wnt通路被激活,表达活跃,研究发现Wnt通路参与心脏心室重构、心肌肥大、心力衰竭过程,本研究发现,差异表达的mRNA显著富集在Wnt通路,且显著上调,可以推断DCM的发生发展可能与Wnt通路的激活有关,干预这条途径可能为DCM的治疗提供新的靶点。本研究应用RNA-seq技术进行筛选影响DCM发生发展的关键基因,初步结果显示的2个候选基因为GSK3β和SFRP2。GSK3β已被证明在心肌肥厚过程中发挥重要作用[11]。有研究表明心力衰竭接受心脏再同步化治疗的狗模型激活GSK3β后引起心肌收缩力增强[12]。有研究表明,SFRP1基因失活可导致老龄及心脏按压后的鼠发生心肌肥大、纤维化和坏死,表明SFRP1下调可诱导人DCM与缺血性心肌病[13]。SFRP2在心力衰竭发展过程中的作用还不明确,在充血性心力衰竭仓鼠模型的心功能研究中,SFRP2过表达被证明可减少心肌细胞凋亡,抑制心肌纤维化[14],在诱导心肌梗死大鼠SFRP2过表达的实验中,发现SFRP2过表达可防止心脏前壁变薄,抑制心室重构[15]。我们认为,目标基因的异常表达与DCM的发生发展有关,需进一步构建动物模型验证。
总之,本研究运用RNA-seq技术构建了DCM的mRNA差异性表达谱,并对差异表达基因进行生物学功能分析,初步定位出候选的关键基因GSK3β和SFRP2,下一步我们将对这些候选基因进行动物模型基因表达验证,并计划通过增加样本量继续研究DCM的基因差异性表达及调控机制,以期揭示DCM的发生发展机制,获得药物治疗靶点。