
对hsa-miR-17-92 cluster及其同源体进行系统的生物信息学分析,预测其可能参与的生物学过程,为深入研究其在脂肪细胞分化、肥胖发生等过程中的功能与机制奠定基础。
1.应用PubMed、Google等信息搜索工具查找hsa-miR-17-92 cluster及其同源体的所有研究,综述已有研究进展;2.应用miRBase获取hsa-miR-17-92 cluster及其同源体的各成员序列,并分析其序列特征及保守性;3.应用美国国家生物技术信息中心(NCBI) blast、NCBI mapviewer、基因组生物信息学(UCSC) Browser工具分析hsa-miR-17-92 cluster及其同源体所在基因组的序列特征;4.应用TargetScan5.1,PicTar及miRanda预测hsa-miR-17-92 cluster及其同源体靶基因,取三者预测结果的交集,进一步进行功能注释和Pathway富集分析。
1.现有研究提示hsa-miR-17-92 cluster及其同源体在脂肪细胞分化、肿瘤疾病、心脏及肺发育、免疫系统与血管形成等生物学过程中有重要作用;2.hsa-miR-17-92 cluster及其同源体进化上高度保守,根据种子序列同源性可分为4类,且在多物种间非常保守;3.hsa-miR-17-92 cluster及其同源体预测靶基因的功能与细胞周期、细胞黏附、Wnt、TGF-β信号、p53、丝裂原活化蛋白激酶等信号通路有较大的相关性,可能参与了前列腺癌、胰腺癌、结肠癌等多种疾病通路。
通过对hsa-miR-17-92 cluster及其同源体系统的生物信息学分析,初步阐明了hsa-miR-17-92 cluster及其同源体的基本生物学特征,并为hsa-miR-17-92 cluster后续研究提供了功能与机制的线索。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
microRNAs(miRNAs)是在真核生物体内发现的一类长度约22 nt的内源性非编码单链小RNA,通过转录后调控机制调控靶基因表达,参与生物体内一系列重要的生命过程[1]。目前,已发现一些miRNAs在基因组上成簇存在,并以多顺反子形式转录[2],其中hsa-miR-17-92 cluster是位于染色体13q32-33的多顺反子[3],其序列在所有脊椎动物中都有高度保守,在多种组织中均有表达,尤其在多种肿瘤组织及细胞中高表达,其还有2个旁系同源体,分别为miR-106a-363 cluster和miR-106b-25 cluster[4]。miR-17-92 cluster主要参与肿瘤、心脏、呼吸及免疫系统等疾病中[5,6],目前尚无儿科相关疾病的报道。机制研究中,仅有1篇文献报道miR-17-92 cluster在3T3-L1脂肪分化中的作用及机制研究,但并未阐明各成员在脂肪分化中的作用[5]。因此,其在儿科疾病中的作用及调控脂肪分化、脂质代谢的具体作用机制仍有待于进一步阐明。本研究根据已有文献报道,阐述miR-17-92 cluster及其同源体参与的生物学过程及功能,通过生物信息学分析其各成员序列保守性和序列特征,并预测其靶基因,对其靶基因进行功能注释分析、信号转导通路富集分析,为进一步阐明miR-17-92 cluster及其同源体在肥胖、脂肪分化及脂质代谢中的作用与机制提供理论基础。
选择PubMed、Google等信息搜索工具综述miR-17-92 cluster已有文献报道的功能研究,尤其在肥胖及脂肪细胞分化中的研究;选择miRBase(http://www.mirBase.org/)查找miRNA序列,分析miR-17-92 cluster序列保守性及序列相似性;选择美国国家生物技术信息中心(NCBI) blast、NCBI mapviewer、基因组生物信息学(UCSC) Browser工具分析hsa-miR-17-92 cluster及其同源体所在基因组特征;选择DIANA LAB-TarBase5.0(http://diana.cslab.ece.ntua.gr/tarbase/)检索已有文献报道miRNA的靶基因;选择TargetScan5.1[7](http://www.targetscan.org/)、PicTar[8](http://pictar.bio.nyu.edu/)及miRanda[9](http://www.microrna.org/)3种计算方法预测miR-17-92 cluster靶基因,将其结果的交集作为进一步分析可能参与脂肪细胞分化的靶基因集合。
将miR-17-92 cluster的靶基因均用GeneOntology(GO)进行功能富集分类,BiNGO软件[10]可以实现基因的GO,根据GO注释中的生物学过程和分子功能行GO注释层次分类及富集分析。用DAVID数据库(http://David.abcc.ncifcrf.gov/)对miR-17-92 cluster预测靶基因集合进行GO注释描述,分别提取到GO注释汇总信息,用BiNGO行GO注释的显著性分析,BiNGO根据基因的GO注释,选择所有的蛋白编码基因作为背景基因,采用Fisher's精确检验,以P<10-4为显著性阈值,分别得到相对于背景基因有统计学意义的高频率注释。根据功能注释和Pathway分析进一步分析其可能参与脂肪细胞分化的靶基因集合。
截至2012年4月1日,以miR-17-92、miR-17-92 cluster、miR-17/92 cluster、miR-106b-25、miR-106a-363为检索关键词,通过PubMed、Google等信息搜索工具,检索发现有208篇文献,涉及具体机制报道约190篇。miR-17-92 cluster主要参与脂肪细胞分化、肿瘤、心脏及肺发育、血管形成、免疫调节等生物学过程[5,6,11,12]。在脂肪细胞及肥胖研究方面仅有1篇文献报道,miR-17-92 cluster通过其靶基因Rb2/p130调节脂肪细胞的分化,过表达可促进3T3-L1脂肪细胞分化[5]。在肿瘤研究方面,miR-17-92 cluster被称为肿瘤miR-1(Oncomir-1),在多种肿瘤组织及细胞中高表达,如消化系统肿瘤(结肠癌、胰腺癌、胃癌)、血液系统肿瘤、前列腺癌、卵巢癌、横纹肌肉瘤、血管肉瘤、恶性胸膜间皮瘤、视网膜母细胞瘤等[13,14,15,16,17,18,19,20]。在心脏发育方面,miR-17-92 cluster(miR-17-5p、miR-20a)通过调节其靶基因FOG-2(心脏发育中关键基因)的表达,抑制小鼠胚胎心肌细胞增殖[21]。在肺发育研究中,Ventura等[4]发现敲除miR-17-92 cluster导致小鼠发育障碍,包括肺发育不全和VSD,出生后小鼠很快死亡;在大鼠肺动脉高压细胞模型中,抑制miR-17通过上调p21改善肺血管和右心室的重塑而改善心肺功能[22]。同时,miR-17-92 cluster在胚胎发育中促进细胞增殖、抑制细胞分化,并且各成员在组织中表达不同,说明各成员在胚胎发育过程中作用不同[23]。在精子发育中的重要作用:miR-17-92 cluster、miR-106b-25 cluster参与调节小鼠精原干细胞的分化[24]。
经miRBase分别检索人(hsa)、小鼠(mmu)、大鼠(rno)、鸡(gga)、斑马鱼(dre)、大猩猩(ggo)等成熟miRNA序列,以miR-17为例说明miR-17-92 cluster的保守性,见表1。miR-17-92 cluster各成员之间也仅存在几个碱基的差异,见表2,通过对miRNA"种子序列"的分析,将miR-17-92 cluster各成员分为4类作为后续靶基因GO分析及生物通路富集分析的相应类别。

不同物种间miR-17序列保守性分析
不同物种间miR-17序列保守性分析
| 名称(物种) | 序列号 | 序列 |
|---|---|---|
| hsa-miR-17-5p(人) | MI0000071 | 14-CAAAGUGCUUACAGUGCAGGUAG-36 |
| mmu-miR-17(小鼠) | MI0000687 | 14-CAAAGUGCUUACAGUGCAGGUAG-36 |
| rno-miR-17-5p(大鼠) | MI0000845 | 14-CAAAGUGCUUACAGUGCAGGUAG-36 |
| gga-miR-17-5p(鸡) | MI0001184 | 14-CAAAGUGCUUACAGUGCAGGUAGU-37 |
| dre-miR-17a(斑马鱼) | MI0001897 | 41-CAAAGUGCUUACAGUGCAGGUA-62 |
| ggo-miR-17-5p(大猩猩) | MI0002965 | 14-CAAAGUGCUUACAGUGCAGGUAGU-37 |

hsa-miR-17-92 cluster各成员之间种子序列碱基的差异
hsa-miR-17-92 cluster各成员之间种子序列碱基的差异
| 类别 | miRNA | 染色体定位 | 序列 |
|---|---|---|---|
| 第1类 | hsa-miR-17 | 13:92002859-92002942[+] | C UACA![]() |
| hsa-miR-93 | 7:99691391-99691470[-] | C GUUC![]() | |
| hsa-miR-20a | 13:92003319-92003389[+] | U UAUA![]() | |
| hsa-miR-20b | X:133303839-133303907[-] | C CAUA![]() | |
| hsa-miR-106a | X:133304228-133304308[-] | A UACA![]() | |
| hsa-miR-106b | 7:99691616-99691697[-] | UAAAGUGCUGACAGUGCAGAU | |
| 第2类 | hsa-miR-18a | 13:92003005-92003075[+] | UAAGGUGCAUCUAGUGCAGAUAG |
| hsa-miR-18b | X:133304071-133304141[-] | UAAGGUGCAUCUAGUGCAGUUAG | |
| 第3类 | hsa-miR-19b-1 | 13:92003446-92003532[+] | UGUGCAAAUCCAUGCAAAACUGA |
| hsa-miR-19a | 13:92003145-92003226[+] | UGUGCAAAUCUAUGCAAAACUGA | |
| hsa-miR-19b-2 | X:133303701-133303796[-] | UGUGCAAAUCCAUGCAAAACUGA | |
| 第4类 | hsa-miR-92a-1 | 13:92003568-92003645[+] | UAUUGCACUUGUCCCGGCCUGU |
| hsa-miR-92a-2 | X:133303568-133303642[-] | UAUUGCACUUGUCCCGGCCUGU | |
| hsa-miR-363 | X:133303408-133303482[-] | AAUUGCACGGUAUCCAUCUGUA | |
| hsa-miR-25 | 7:99691183-99691266[-] | CAUUGCACUUGUCUCGGUCUGA |
选择NCBI blast、NCBI mapviewer、UCSC Browser工具分析发现miR-17-92位于人的第13号染色体上C13orf25基因初级转录本的第3个内含子区,编码miR-17-5p、miR-17-3p、miR-18a、miR-19a、miR-20a、miR-19b-1和miR-92-1等7个miRNAs,根据他们的种子序列可以将miR-17-92 cluster分为3个家族:miR-17家族(miR-17、miR-18、miR-20),miR-19家族(miR-19a、miR-19b)和miR-92家族。miR-106a-363基因簇位于人和小鼠的X染色体上,包含miR-106a、miR-18b、miR-20b、miR-19b-2、miR-92-2和miR-363 6个miRNAs,miR-106b-25基因簇包含miR-106b、miR-93和miR-25,位于人第7号染色体上蛋白质编码基因MCM7的第13个内含子区,见图1。


根据hsa-miR-17-92 cluster各成员"种子序列"将整个cluster成员分为4类,以便后续GO分析和Pathway分析。分别通过检索miRNA靶基因预测的3个数据库(TargetScan5.1、PicTar、miRanda),取其预测靶基因的交集作为后续GO分析及pathway分析的基因集,通过BiNGO可以实现基因的GO注释层次分类及富集分析,得到以下5种分类的GO分析和Pathway分析结果,见表3,表4,表5,表6及图2,图3,图4,图5。

第1类hsa-miR-17-92 cluster预测靶基因GO分析结果(P<10-7)
第1类hsa-miR-17-92 cluster预测靶基因GO分析结果(P<10-7)
| GO号 | GO名称 | 基因数 | 靶基因 |
|---|---|---|---|
| 0007050 | 细胞周期阻滞 | 6 | CDKN1A;PCAF;CUL3;HBP1;PKD2;THBS1 |
| 0006916 | 抗凋亡 | 5 | HIPK3;BCL2;BCL2L2;TBX3;THBS1 |
| 0007155 | 细胞黏附 | 7 | APP;ITGB8;PCDHA2;PCDHA6;PCDHAC1;PCDHAC2;THBS1 |
| 0001666 | 低氧应答 | 4 | BCL2;EPAS1;SMAD4;THBS1 |
| 0007264 | 小G酶调节信号 | 6 | ARHGAP1;DNAJC27;RAB30;RAB8B;RASL11B;RHOC |
| 0006915 | 凋亡 | 7 | APP;HIPK3;FASTK;RABEP1;TNFRSF21;TNFSF12;TP53INP1 |
| 0045766 | 血管生成 | 3 | RUNX1;THBS1;TNFSF12 |
| 0016567 | 泛素化蛋白 | 4 | MYLIP;FBXL5;FBXW11;NEDD4L |
| 0019941 | 修饰依赖的蛋白代谢 | 6 | MYLIP;FBXL5;FBXO5;FBXO31;FBXW11;NEDD4L |
| 0008285 | 负性调节细胞增殖 | 5 | CDKN1A;PCAF;PTEN;PTPRU;SMAD4 |
| 0008284 | 正性调节细胞增殖 | 5 | BCL2;CUL3;DERL2;SOX4;TBX3 |
| 0006816 | 钙转运 | 4 | ATP2B2;ATP2B4;PKD2;TRPV6 |
| 0007156 | 亲和细胞黏附 | 4 | PCDHA2;PCDHA6;PCDHAC1;PCDHAC2 |
| 0000082 | G1/S期转变 | 3 | CDKN1A;BCL2;CUL3 |
| 0007399 | 神经系统发育 | 6 | MYLIP;PCDHA2;PCDHA6;PCDHAC1;PCDHAC2;STAT3 |

第1类hsa-miR-17-92 cluster预测靶基因Pathway分析结果(P<10-4)
第1类hsa-miR-17-92 cluster预测靶基因Pathway分析结果(P<10-4)
| 通路 | 基因数 | 靶基因 |
|---|---|---|
| 黏附 | 7 | CDKN1A;BCL2;ITGB8;MAPK9;PDGFRA;PTEN;THBS1 |
| p53信号通路 | 4 | CDKN1A;CCNG2;PTEN;THBS1 |
| 胰腺癌 | 4 | JAK1;MAPK9;SMAD4;STAT3 |
| Wnt信号通路 | 5 | FBXW11;MAPK9;NFAT5;PLCB1;SMAD4 |
| 结肠癌 | 4 | BCL2;MAPK9;PDGFRA;SMAD4 |
| ErbB信号通路 | 4 | CDKN1A;CDKN1A;GAB1;MAPK9 |
| TGF-β信号通路 | 4 | BMPR2;RBL2;SMAD4;THBS1 |
| 前列腺癌 | 4 | CDKN1A;BCL2;PDGFRA;PTEN |
| 钙信号通路 | 5 | ATP2B2;ATP2B2;P2RX4;PDGFRA;PLCB1 |
| T淋巴细胞受体信号通路 | 4 | CDKN1A;MAP3K8;MAPK9;NFAT5 |
| 轴突导向 | 4 | CDKN1A;NFAT5;SRGAP3;SRGAP3 |
| 泛素介导的蛋白水解 | 4 | ITCH;CUL3;FBXW11;NEDD4L |
| 丝裂原活化蛋白激酶(MAPK)信号通路 | 5 | DUSP8;MAP3K2;MAP3K8;MAPK9;PDGFRA |
| 胶质瘤 | 3 | CDKN1A;PDGFRA;PTEN |
| 脂肪细胞因子 | 3 | ACSL4;MAPK9;STAT3 |
| 黑色素瘤 | 3 | CDKN1A;PDGFRA;PTEN |
| 肾细胞癌 | 3 | CDKN1A;GAB1;HLF |
| 慢性粒细胞白血病 | 3 | CDKN1A;RUNX1;SMAD4 |
| 缝隙连接 | 3 | MAP3K2;PDGFRA;PLCB1 |

第3类hsa-miR-17-92 cluster预测靶基因Pathway分析结果(P<10-4)
第3类hsa-miR-17-92 cluster预测靶基因Pathway分析结果(P<10-4)
| 通路 | 基因数 | 靶基因 |
|---|---|---|
| MAPK信号通路 | 9(10.23%) | RAF1;NLK;RAP1A;RAP1B;MAP3K12;CACNA1C;PRKACB;TGFBR2;MAPK14 |
| Wnt信号通路 | 8(9.09%) | NLK;CCND1;PRKACB;CCND2;PRICKLE2;DAAM1;WNT3;SMAD4 |
| 钙信号通路 | 7(7.95%) | SPHK2;CACNA1C;PTK2B;PRKACB;ATP2B2;ATP2B2;ERBB4 |
| 黏附 | 7(7.95%) | RAF1;RAP1A;RAP1B;ITGA6;CCND1;CCND2;PTEN |
| TGF-β信号通路 | 6(6.82%) | ZFYVE9;SMAD5;INHBB;BMPR2;SMAD4;TGFBR2 |
| 酪氨酸受体信号通路 | 6(6.82%) | SOCS1;CCND1;SOCS5;CNTFR;CCND2;SOCS3 |
| 长时程效应 | 5(5.68%) | RAF1;RAP1A;RAP1B;CACNA1C;PRKACB |
| 促性腺激素释放激素信号通路 | 5(5.68%) | RAF1;CACNA1C;PTK2B;PRKACB;MAPK14 |
| 胰岛素信号通路 | 5(5.68%) | RAF1;SOCS1;PRKACB;PRKAA1;SOCS3 |
| 脂肪细胞因子 | 4(4.55%) | ADIPOR2;ACSL4;PRKAA1;SOCS3 |
| p53信号通路 | 4(4.55%) | IGFBP3;CCND1;CCND2;PTEN |
| 肾细胞癌 | 4(4.55%) | RAF1;RAP1A;RAP1B;HLF |
| 胰腺癌 | 4(4.55%) | RAF1;CCND1;SMAD4;TGFBR2 |
| 慢性粒细胞白血病 | 4(4.55%) | RAF1;CCND1;SMAD4;TGFBR2 |
| 结肠癌 | 4(4.55%) | RAF1;CCND1;SMAD4;TGFBR2 |

第4类hsa-miR-17-92 cluster预测靶基因Pathway分析结果(P<10-4)
第4类hsa-miR-17-92 cluster预测靶基因Pathway分析结果(P<10-4)
| 通路 | 基因数 | 靶基因 |
|---|---|---|
| TGF-β信号通路 | 4(14.81%) | BMPR2;SMAD4;TGFBR2;THBS1 |
| 慢性粒细胞白血病 | 3(11.11%) | CDKN1A;SMAD4;TGFBR2 |
| 细胞周期 | 3(11.11%) | CDKN1A;SMAD4;CDKN1C |
| 黏附 | 3(11.11%) | CDKN1A;ITGA5;THBS1 |
| 膀胱癌 | 2(7.41%) | CDKN1A;THBS1 |
| p53信号通路 | 2(7.41%) | CDKN1A;THBS1 |
| 胰腺癌 | 2(7.41%) | SMAD4;TGFBR2 |
| 黏附连接 | 2(7.41%) | SMAD4;TGFBR2 |
| 细胞外基质(ECM)受体相互作用 | 2(7.41%) | ITGA5;THBS1 |
| 结肠癌 | 2(7.41%) | SMAD4;TGFBR2 |
| ErbB信号通 | 2(7.41%) | CDKN1A;CDKN1A |








目前miRBase已释放人类miRNA有2088条,调控人类约1/3的基因[25]。已知,机体内1条miRNA有调控多个基因的功能,也可以借助多个miRNA对某个特定基因进行时空特异的精密调控,miRNA这种一对多、多对一的调控方式,导致其功能研究的复杂性。目前较多的研究表明,miR-17-92 cluster不同成员之间功能相似或各有其功能[26,27,28]。本研究通过文献复习综述目前miR-17-92的研究现状、根据人miR-17-92基因簇成员中"种子序列"的异同,将整个miRNA簇中各成员分为4类进行GO及Pathway分析,为后续不同实验研究提供研究思路的参考,也有利于探讨整个基因簇各成员不同生物学功能和相似的生物学功能。目前虽已有部分miR-17-92 cluster靶基因被研究者验证,但通过生物信息学分析miRNA靶基因参与生物学过程及分子组成和靶基因富集的Pathway等仍然是进行科学研究必要的前提。
miR-17-92 cluster是一个多顺反子miRNA[3],在多种细胞类型中广泛表达,同时也被定义为肿瘤miR-1,其主要参与脂肪细胞分化、肿瘤、心脏及肺发育、血管形成、免疫调节等生物学过程[5,6,11,12]。He等[3]在B淋巴细胞瘤小鼠模型中,应用缺少miR-92片段的miR-17-19b转入小鼠发现,其促进B淋巴细胞瘤的增殖、抑制c-myc诱导B淋巴细胞凋亡。Ventura等[4]发现敲除miR-17-92 cluster导致小鼠肺发育不全和VSD,出生后小鼠很快死亡。然而,在B淋巴细胞特异性敲除Dicer后,B淋巴细胞中miRNAs不能合成,其表型和miR-17-92 cluster敲除后产生的表型相似。因此,Dicer敲除产生的表型有部分归因于缺少miR-17-92 cluster。同时敲除miR-17-92 cluster和miR-106b-25 cluster导致更为严重的表型和更多的缺陷表型[8],说明miR-17-92 cluster中每个成员均可能发挥独立作用。
本研究分别利用3个数据库(TargetScan5.1、Pic-Tar、miRanda)预测hsa-miR-17-92 cluster及其同源体的靶基因,取3个数据库交集的靶基因进行GO分析和Pathway分析,发现hsa-miR-17-92 cluster及其同源体预测靶基因主要富集于细胞周期、细胞黏附、Wnt、TGF-β信号、p53、MAPK等信号通路及前列腺癌、胰腺癌、结肠癌等多种疾病通路中。为后续本课题组hsa-miR-17-92 cluster及其同源体在人脂肪细胞中的调控机制及肥胖发生机制的探讨提供理论基础,由于数据库和软件分析具有一定的局限性,本研究分析得到的结果还需要进一步验证。





UACA
GUUC
UAUA
CAUA
UACA



















