
在全基因组水平上,探讨维吾尔族多囊卵巢综合征(PCOS)患者卵巢组织的特异性甲基化谱改变。
选择2014年5月至2016年6月,于喀什地区第一人民医院进行诊治的60例维吾尔族PCOS患者的卵巢组织(PCOS组)及60例维吾尔族卵巢囊肿患者的正常卵巢组织(对照组)为研究对象。采用甲基化DNA免疫共沉淀结合芯片(MeDIP-chip)技术,对2组卵巢组织的基因组DNA进行全基因组胞嘧啶-磷酸-鸟嘌呤(CpG)岛和启动子区域甲基化扫描。将MeDIP-chip结果中,峰值得分≥2的区域,判定为阳性甲基化区域,以筛选甲基化基因;对PCOS卵巢组织峰值得分≥5的特异性高甲基化基因,进行基因本体(GO)分析及Pathway分析,以探讨这些特异性高甲基化基因对机体相关功能的影响。对2组卵巢组织的甲基化谱差异,采用配对t检验及χ2检验进行统计学比较。本研究遵循的程序符合2013年修订的《世界医学协会赫尔辛基宣言》的要求,所有受试者均自愿参加本研究,并签署知情同意书。
① MeDIP-chip结果显示:PCOS组全基因组CpG岛和启动子的甲基化率,分别为12.9%(3 633/28 226)和3.8%(687/18 028),对照组分别为13.3%(3 759/28 226)和3.6%(643/18 028)。2组卵巢组织全基因组整体甲基化水平,以及甲基化片段在基因组各区的分布比较,差异均无统计学意义(P>0.05)。②2组卵巢组织全基因组转录调控区的上游调控区和核心启动子区域甲基化水平比较,差异均无统计学意义(P>0.05)。PCOS组转录调控区的基因编码区甲基化水平为(3.14±0.21),显著低于对照组的(3.96±0.23),并且差异有统计学意义(t=2.653,P=0.010)。③2组卵巢组织全基因组高甲基化启动子的高-CpG含量启动子(HCP)、中-CpG含量启动子(ICP)及低-CpG含量启动子(LCP)的分布比较,差异有统计学意义(χ2=3.208,P=0.002),其中PCOS组卵巢组织全基因组HCP比例最高(40.1%),对照组HCP比例则最低(13.3%)。PCOS组卵巢组织全基因组HCP甲基化水平为(0.68±0.08),低于对照组的(0.71±0.09),而ICP及LCP甲基化水平分别为(0.74±0.13)和(0.76±0.11),则高于对照组的(0.61±0.07)和(0.32±0.03),并且差异均有统计学意义(t=1.686,P=0.049;t=1.992,P=0.028;t=3.361,P=0.002)。④ GO分析及Pathway分析结果显示:维吾尔族PCOS患者卵巢组织的特异性高甲基化基因,主要参与受体结合、蛋白质结合、激素活性、转录调节活性、转录因子活性和DNA结合等过程。
维吾尔族PCOS患者卵巢组织的基因编码区甲基化水平,较正常卵巢组织低;全基因组高甲基化启动子的HCP比例最高,但是甲基化水平较正常卵巢组织的低,ICP及LCP的甲基化水平,较正常卵巢组织的高。这些特异性甲基化改变,可能与维吾尔族女性的PCOS发生、发展有关系。
版权所有,未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别申明,本刊刊出的所有文章不代表中华医学会和本刊编辑委员会的观点。
本刊为电子杂志,以光盘形式出版。本册应读者需求按需印刷,随光盘免费赠阅。光盘如有质量问题,请向编辑部调换。
DNA甲基化是表观遗传学中最常见的一种修饰,其主要形式包括5-甲基胞嘧啶、少量的N6-甲基腺嘌呤及7-甲基鸟嘌呤[1]。DNA甲基化在调控基因表达方面起着重要作用,当DNA甲基化出现于转录起始位置附近时,与基因表达的抑制有关联[2]。所谓DNA甲基化是指胞嘧啶-磷酸-鸟嘌呤(cytosine-phosphoric acid-guanine, CpG)甲基化,即在DNA甲基化转移酶作用下,使CpG二核苷酸5’-胞嘧啶转变为5’-甲基胞嘧啶。哺乳动物体细胞的DNA胞嘧啶甲基化,主要发生在CpG岛;CpG岛是指CpG序列相比整个基因组来说特别高的富集区域,一般位于启动子附近、5’-端非翻译区或第一个外显子[3]。多囊卵巢综合征(polycystic ovary syndrome, PCOS)是生育年龄女性常见的、复杂的内分泌及代谢异常所致疾病,是最常见女性内分泌疾病之一;PCOS患者以慢性无排卵(排卵功能紊乱或丧失所致)和高雄激素血症(女性体内男性激素产生过剩所致)为特征[4]。这些均提示卵巢是PCOS发生遗传学异常改变的重要靶器官[5,6,7]。
本研究采用甲基化DNA免疫共沉淀结合芯片(methylated DNA immunoprecipitation-chip, MeDIP-chip)技术,分别对PCOS卵巢组织和正常卵巢组织全基因组CpG岛和启动子区域的CpG二核苷酸位点进行检测,以确定PCOS患者卵巢组织的DNA甲基化位点差异;通过生物信息学技术,分别从全基因组总体DNA甲基化水平和特异位点上的DNA甲基化水平2方面,进一步对MeDIP-chip结果进行分析,以找到PCOS卵巢组织基因组的特异性甲基化改变;并将PCOS卵巢组织中的特异性高甲基化基因,按照其生物学功能及其产物进行富集分析,旨在探寻与PCOS发病相关的候选基因。现将研究结果报道如下。
选择2014年5月至2016年6月,于喀什地区第一人民医院进行诊治的60例维吾尔族PCOS患者的卵巢组织(PCOS组)及60例维吾尔族卵巢囊肿患者的正常卵巢组织(对照组)为研究对象。将对照组患者按照年龄均数±3岁,人体质量指数均数±3 kg/m2的原则,与PCOS组进行匹配。本研究遵循的程序符合2013年修订的《世界医学协会赫尔辛基宣言》,所有受试者均自愿参加本研究并签署知情同意书。
本研究受试者纳入标准:①年龄为18~30岁,体重为40~50 kg,未婚女性,无吸烟史,无肥胖者。②PCOS组患者符合PCOS诊断标准[8]:无排卵或稀发排卵,雄激素水平升高的临床或生物化学改变,卵巢多囊性改变。符合上述3项临床特征中的2项,并排除可能引起高雄激素的其他疾病,则可被诊断为PCOS。③对照组患者符合卵巢囊肿诊断标准;月经周期规则,基础体温双相;超声检查无多囊卵巢改变;内分泌检测无异常;卵巢组织病理学检查结果为正常卵巢组织。④采用定量聚合酶链反应,验证MeDIP-chip检测结果为正确者。排除标准:①罹患子宫内膜异位症、肿瘤、糖尿病、心血管疾病、原发性高血压疾病、甲状腺功能及泌乳素异常等,可能影响MeDIP-chip检测结果的疾病者;②有内分泌功能失调性疾病、妊娠试验呈阳性,以及严重肝、肾功能不全及血液系统疾病者;③近3个月有精神类或激素类药物应用史者。
对PCOS患者在进行腹腔镜下卵巢打孔术过程中,在卵巢的皮质进行取样,得到PCOS卵巢组织,每例患者取双侧卵巢皮质,大小各约为5 mm×5 mm。对照组卵巢囊肿患者在进行腹腔镜卵巢囊肿剔除术中,取剔除囊肿组织后附带丢失的部分正常卵巢的皮质,大小约为10 mm×10 mm。
本研究主要实验步骤依次如下。①对手术取材的卵巢组织进行DNA提取;②采用MeDIP-chip技术,对提取的卵巢组织DNA进行全基因组CpG岛和启动子区域甲基化状态分析,找到卵巢组织的特异性甲基化基因,并进行2组卵巢组织甲基化谱比较;③对筛选出来的PCOS卵巢组织中的特异性高甲基化基因进行基因本体(gene ontology,GO)分析及Pathway分析,以探讨这些特异性高甲基化基因对机体功能的潜在影响,明确基因改变的功能差异、与PCOS发病相关的机制。
采取MeDIP-chip技术对2组卵巢组织样本进行全基因组CpG岛和启动子区域的CpG二核苷酸位点检测,委托上海伯豪生物技术有限公司进行。其实验流程主要包括超声裂解DNA、甲基化DNA免疫共沉淀、MeDIP与Input DNA片段线性扩增、荧光标记、芯片杂交及图像采集等,其具体操作流程,见参考文献[9]。本研究采用的甲基化特异性芯片为NimbleGen HG18 CpG Promoter Microarray Methlation(批号:1607~1610,瑞士NimbleGen公司)。该芯片共覆盖385K个探针,覆盖的区域包括UCSC(University of California Santa Cruz)基因组数据库中,HG18版本注释的人类全部18 028个基因的启动子区和28 226个CpG岛。
采用NimbleGen Scan软件对MeDIP-chip结果进行数据提取、标准化、峰值分析及报告。①相对富集强度:对原始探针扫描信号的原始数据,经过数据校正得到Log2(IP/input)值,此值代表每个探针在DNA片段中的相对富集强度。其中IP为样本探针信号,input为对照品探针信号。②p值:采用ACME法,计算每个探针的p值(p Value)。p值表示Log2(IP/input)值是由随机因素造成而非真实值的概率,通常以-lg p代替原始p值;③峰值得分:根据每个探针的p值计算该探针的峰值得分(peaks score)。将峰值得分≥2的区域,定义为阳性甲基化区域。特异性高甲基化基因是指甲基化片段峰值得分≥5的基因。DNA甲基化片段的峰值得分值与该片段的甲基化程度呈正比,可以间接反映该DNA片段甲基化水平的高低。
按照CpG的富集程度(CpG率),可将启动子分为3类:高-CpG含量启动子(high CpG promoters,HCP),CpG率>60%;中-CpG含量启动子(intermediate CpG promoters,ICP),CpG率为30%~60%;低-CpG含量启动子(low CpG promoters,LCP),CpG率<30%。基因转录调控区包括距转录起始位点(transcription start site, TSS)-2 000bp~-1 000 bp的上游调控区,距TSS为-800 bp~+200 bp的核心启动子区域,以及距TSS为+200 bp~+1 000 bp的基因编码区,共3个区域。
GO分析及Pathway分析均使用GeneGO公司的网站http://www.protal.genego.com及Metacore version 2.0软件,将PCOS组卵巢组织中特异性高甲基化基因,按照细胞组分(cellular component)、生物学过程(biological process)及分子功能(molecular function),进行GO注释和分类;Pathway分析原理为按照基因所编码蛋白质参与的信号通路对基因进行分类。在本研究GO分析或Pathway分析的丰度统计条图中,p值代表某基因在GO分析或Pathway分析中的富集情况,p值越小,表示该基因在GO某项注释或信号通路中的富集度越高;对p值进行常用对数转换,则lg(p Value)越大,该基因在GO某项注释或信号通路中的富集度越高,代表此项注释或信号通路与PCOS发病相关程度越高。
本研究数据资料采用SPSS 21.0统计学软件包进行统计学处理。对2组卵巢组织样本的甲基化水平等呈正态分布而且方差齐性计量资料,采用
±s表示,组间比较采用配对t检验。对甲基化片段在基因各区的分布、卵巢组织全基因组中高甲基化启动子的3种类型(HCP、ICP及LCP)分布等计数资料(构成比),采用率(%)表示,组间比较采用χ2检验。所有统计学检验采用双侧检验,以P<0.05表示差异有统计学意义。
MeDIP-chip检测结果显示:PCOS组3 633个CpG岛和687个基因的启动子发生甲基化,分别占本研究芯片覆盖的全部CpG岛和基因启动子数的12.9%(3 633/28 226)和3.8%(687/18 028);对照组3 759个CpG岛和643个基因的启动子发生甲基化,分别占13.3%(3 759/28 226)和3.6%(643/18 028)。2组卵巢组织全基因组整体甲基化水平,以及甲基化片段在基因组各区的分布比较,差异均无统计学意义(P>0.05),见表1。

2组卵巢组织全基因组整体甲基化水平及甲基化片段在基因组各区的分布比较
2组卵巢组织全基因组整体甲基化水平及甲基化片段在基因组各区的分布比较
| 组别 | 例数 | 甲基化片段数(个) | 甲基化水平 | 甲基化片段在基因组各区分布[%(n/n′)] | |||||
|---|---|---|---|---|---|---|---|---|---|
| 基因未知区 | 启动子区 | 基因间区 | 基因下游区 | 缺失启动子区 | 缺失基因下游区 | ||||
| PCOS组 | 60 | 687 | 2.63±0.26 | 40.0(275/687) | 24.0(165/687) | 22.0(151/687) | 7.0(48/687) | 5.0(34/687) | 2.0(14/687) |
| 对照组 | 60 | 643 | 2.71±0.22 | 42.9(276/643) | 23.0(148/643) | 20.1(129/643) | 7.0(45/643) | 5.0(32/643) | 2.0(13/643) |
| 检验值 | t=1.431 | χ2=21.576 | |||||||
| P值 | 0.089 | 0.086 | |||||||
注:PCOS为多囊卵巢综合征。n为基因组某区甲基化片段数,n′为基因组中甲基化片段总数
2组卵巢组织基因转录调控区的上游调控区和核心启动子区域甲基化水平比较,差异均无统计学意义(P>0.05)。PCOS组转录调控区的基因编码区甲基化水平低于对照组,并且差异有统计学意义(P<0.05)。2组卵巢组织基因转录调控区不同区域的甲基化水平比较,见表2。

2组卵巢组织基因转录调控区不同区域的甲基化水平比较(
±s)
2组卵巢组织基因转录调控区不同区域的甲基化水平比较(
±s)
| 组别 | 例数 | 上游调控区 | 核心启动子区域 | 基因编码区 |
|---|---|---|---|---|
| PCOS组 | 60 | 4.65±0.24 | 2.82±0.16 | 3.14±0.21 |
| 对照组 | 60 | 3.72±0.36 | 2.83±0.19 | 3.96±0.23 |
| t值 | 1.271 | 0.571 | 2.653 | |
| P值 | 0.104 | 0.290 | 0.010 |
注:PCOS为多囊卵巢综合征
2组卵巢组织全基因组高甲基化启动子的3种类型HCP、ICP及LCP分布比较,差异有统计学意义(P<0.05),其中PCOS组卵巢组织全基因组HCP比例最高(40.1%),对照组HCP比例则最低(13.3%)。PCOS组卵巢组织全基因组HCP甲基化水平低于对照组,ICP及LCP甲基化水平则高于对照组,并且差异均有统计学意义(P<0.05)。2组卵巢组织全基因组高甲基化启动子的3种类型分布及不同类型启动子的甲基化水平比较,见表3。

2组卵巢组织全基因组高甲基化启动子的3种类型分布及不同类型启动子的甲基化水平比较
2组卵巢组织全基因组高甲基化启动子的3种类型分布及不同类型启动子的甲基化水平比较
| 组别 | 例数 | 高甲基化启动子数(个) | 高甲基化启动子类型分布[个(%)] | 甲基化水平( ±s) | ||||
|---|---|---|---|---|---|---|---|---|
| HCP | ICP | LCP | HCP | ICP | LCP | |||
| PCOS组 | 60 | 342 | 137(40.1) | 132(38.6) | 73(21.3) | 0.68±0.08 | 0.74±0.13 | 0.76±0.11 |
| 对照组 | 60 | 301 | 40(13.3) | 112(37.2) | 149(49.5) | 0.71±0.09 | 0.61±0.07 | 0.32±0.03 |
| 检验值 | χ2=3.208 | t=1.686 | t=1.992 | t=3.361 | ||||
| P值 | 0.002 | 0.049 a | 0.028 | 0.002 | ||||
注:a由于P值接近0.05,采用秩和检验进一步进行比较后,确认为P<0.05。PCOS为多囊卵巢综合征。HCP为高-CpG含量启动子,ICP为中-CpG含量启动子,LCP为低-CpG含量启动子,CpG为胞嘧啶-磷酸-鸟嘌呤
根据甲基化水平(峰值得分)>5,本研究维吾尔族PCOS患者卵巢组织全基因组特异性高甲基化基因为342个。对这些高甲基化基因进行GO分析及Pathway分析的结果显示,PCOS卵巢组织全基因组的特异性高甲基化基因,主要参与受体结合、蛋白质结合、激素活性、转录调节活性、转录因子活性和DNA结合等过程。该分析结果具体如下:①富集度由高到低的前12个参与调控的细胞组分依次为:细胞内域(intracellular part)、细胞内的(intracellular)、阳离子通道复合物(cation channel complex)、层黏连蛋白1复合物(laminin-1 complex)、固定于细胞膜(anchored to membrane)、层黏连蛋白复合物(laminin complex)、甘露糖基转移酶复合物(mannosyltransferase complex)、多萜醇-磷酸-甘露糖合成酶复合物(dolichol-phosphate-mannose synthase complex)、细胞基底层(basal lamina)、固定于细胞质膜(anchored to plasma membrane)、内在的细胞质膜(intrinsic to plasma membrane)、细胞外基质蛋白质(proteinaceous extracellular matrix),见图1A;②富集度由高到低的前12个参与调控的生物学过程依次为:神经系统发育(nervous system development)、神经投射形态发生(nervous projection morphogenesis)、神经投射发育(nervous projection development)、参与细胞形态发生(cell morphogenesis involved)、细胞发育(cell development)、发育过程(developmental process)、细胞投射(cell projection)、多细胞生物发育(multicellular organismal development)、中枢神经系统发育(central nervous system development)、细胞投射组织(cell projection organization)、细胞部分形态发生(cell part morphogenesis)、血管收缩调节(regulation of vasoconstriction),见图1B;③富集度由高到低的前12位参与调控的分子功能依次为:1型黑皮质素受体结合(type 1 melanocortin receptor binding)、3型黑皮质素受体结合(type 3 melanocortin receptor binding)、4型黑皮质素受体结合(type 4 melanocortin receptor binding)、黑皮质素受体结合(melanocortin receptor binding)、结合(binding)、蛋白结合(protein binding)、激素活性(hormone activity)、转录调节活性(transcription regulator activity)、转录因子活性(transcription factor activity)、G蛋白偶联受体结合(G-protein-coupled receptor binding)、DNA结合(DNA binding)、序列特异性DNA结合(sequence-specific DNA binding),见图1C;④富集度由高到低的前12条参与调控的信号通路依次为:发育_A2A受体信号(development_A2A receptor signaling)、发育_NOTCH1介导的NP-KB活性调节途径(development_NOTCH1-mediated pathway for NP-KB activity modulation)、神经生理过程_神经冲动的ACM调节(neurophysiological process_ACM regulation of nerve impulse)、发育_胃黏膜分化中的胃泌素(development_gastrin in differentiation of the gastric mucous)、发育_细胞生长与增值中的胃泌素(development_gastrin in cell growth and proliferation)、发育_WNTSA信号(development_WNTSA signaling)、发育_经由促分裂原活化蛋白激酶级联的PDG信号(development_PDG signaling via MAPK cascades)、免疫应答_胃泌素炎症反应(immune response_gastrin inflammatory response)、细胞凋亡与生存_膜结合ESRI的抗细胞凋亡作用(apoptotic and survival_anti-apoptotic action of membrane-bound ESRI)、神经生理过程_甲状腺素在细胞超极化与兴奋性中的作用(neurophysiological process_thyroxine in cell hyperpolarization and excitability)、免疫应答_CO28信号(immune response_CO28 signaling)、免疫应答_DAP12受体在自然杀伤细胞中的作用(immune response_role of DAP12 receptors in NK cell),见图1D。维吾尔族PCOS患者卵巢组织特异性高甲基化基因的GO分析及Pathway分析丰度统计条图,见图1。


注:GO为基因本体
PCOS是由多基因异常导致的女性内分泌紊乱性疾病,遗传及环境因素在该病的发生和病理、生理过程中起着重要作用。PCOS的发病机制迄今尚不明确,越来越多的学者认为,表观遗传学改变在其发病过程中起重要作用[10,11]。表观遗传学改变的重要机制之一,是DNA甲基化[12,13]。张亚茹[14]研究结果显示,PCOS患者和健康对照者之间整体DNA甲基化水平无差异,并提出对特定组织和目标基因区域进行研究,可以进一步了解表观遗传学改变对PCOS发病的影响。
本研究采用高通量的MeDIP-chip技术,对维吾尔族PCOS患者卵巢组织及维吾尔族卵巢囊肿患者的正常卵巢组织的全基因组DNA甲基化情况进行分析。根据MeDIP-chip结果,维吾尔族PCOS患者卵巢组织全基因组的甲基化谱主要具有以下3个特点。
首先,卵巢组织全基因组的甲基化模式如下。PCOS患者为:①发生甲基化的CpG岛占芯片覆盖全基因组CpG岛总数的12.9%,甲基化的基因启动子占芯片覆盖全基因组启动子总数的3.8%;②DNA甲基化片段在基因组各区的分布,基因未知区占40.0%、启动子区占24.0%、基因间区占22.0%、基因下游区占7.0%、缺失启动子区占5.0%、缺失基因下游区占2.0%。正常者为:①发生甲基化的CpG岛占芯片覆盖全基因组CpG岛总数的13.3%,甲基化的基因启动子占芯片覆盖全基因组启动子总数的3.6%;②DNA甲基化片段在基因组各区的分布,基因未知区占42.9%、启动子区占23.0%、基因间区占20.1%、基因下游区占7.0%、缺失启动子区占5.0%、缺失基因下游区占2.0%。这些结果提示,PCOS卵巢组织全基因组总体甲基化模式变化不大,造成PCOS特异性病理、生理改变的原因,可能与一些特殊位点或者一些特异性基因的甲基化改变有关。
其次,PCOS卵巢组织基因组存在特异转录调控区域的甲基化改变。PCOS卵巢组织与正常卵巢组织基因组,在转录调控区的上游调控区和核心启动子区域的甲基化水平比较,差异均无统计学意义(P>0.05);而PCOS卵巢组织在基因编码区的甲基化水平,则低于正常卵巢组织,差异有统计学意义(P<0.05),这种低甲基化可能导致在错误的位点开始转录。转录调控区域的这种异常甲基化改变,可能与PCOS的发生有关。
第三,在哺乳动物基因组中,CpG二核苷酸出现的频率较其他核苷酸序列出现的频率低很多,这可能与5’-甲基胞嘧啶脱氨基,突变为胸腺嘧啶(T)有关,并且CpG岛大部分处于非甲基化状态[15]。本研究结果显示,PCOS卵巢组织全基因组的高甲基化启动子大部分为HCP,并且PCOS卵巢组织HCP的甲基化水平低于正常卵巢组织,ICP和LCP的甲基化水平,则高于正常卵巢组织,差异均有统计学意义(P<0.05)。考虑到本研究样本量的局限性,笔者认为,卵巢组织中CpG聚集而保护启动子不被甲基化,从而对整体基因组稳定性的维持作用,可能对PCOS的发病有影响。
目前,对人类PCOS的表观遗传学研究可见于如下文献报道。Hickey等[16]研究结果显示,雄激素受体(androgen receptor,AR)的(CAG)n特异性甲基化位点和甲基化模式,影响PCOS的发生;X染色体失活与PCOS的不同临床表现有关。Dasgupta等[17]研究结果显示,AR的CAG重复多态性偶联及X染色体失活,与南印第安人PCOS的临床表现有关。Laisk等[18]研究结果显示,AR的CAG重复多态性及X染色体失活,影响PCOS患者体内卵泡刺激素与促黄体激素水平,并且可能与卵巢早衰的发生有关。
本研究结果还显示,在维吾尔族PCOS患者卵巢组织中发生特异性高甲基化的基因有342个,主要参与受体结合、蛋白质结合、激素活性、转录调节活性、转录因子活性和DNA结合等过程。这些基因中,可能包含维吾尔族PCOS患者发病的重要靶基因,并且有较多基因与激素活性有关,因此这些基因可能参与PCOS的异常内分泌改变,其高甲基化是否与PCOS的发病、病理及临床表现相关,尚需进一步研究。
综上所述,维吾尔族PCOS患者卵巢组织的基因编码区甲基化水平较正常低;全基因组高甲基化启动子的HCP比例最高,但是甲基化水平却较正常卵巢组织的低;PCOS患者卵巢组织的ICP及LCP甲基化水平,较正常卵巢组织高。这些特异性甲基化改变,可能与PCOS的发生、发展有关系。DNA甲基化对基因表达的调节是复杂及可逆的,与其他多种调节因素共同作用并相互影响[19]。因此,对DNA甲基化在维吾尔族PCOS发病中的作用,尚需进行更深入及更广泛的研究。

±s)



















