
分析探讨柯尔克孜族和维吾尔族两个人群过氧化物酶体增殖物激活受体γ(PPARG)基因重组热点特征及连锁不平衡(LD)模式。
采用基质辅助激光解吸电离飞行时间质谱(MALDI-TOF-MS)方法对2013年8月采自新疆克孜勒苏柯尔克孜自治州阿图什市哈拉峻乡柯尔克孜族50例2型糖尿病患者(糖尿病组)、50名健康对照居民(健康对照组)和2012年5月采自新疆南疆和田地区的50名维吾尔族健康对照居民(维吾尔健康对照组)血液样品进行PPARG基因的31个标签单核苷酸多态性(taqSNP)位点的基因分型,采用Hotspot Fisher和Haploview软件推断该两个族群的PPARG基因重组热点特征及其LD模式。
柯尔克孜糖尿病组、健康对照组和维吾尔健康对照组均有18个tagSNP相同(rs1151999、rs1175540、rs1875796、rs1899951、rs2292101、rs2921190、rs2938397、rs2959272、rs2959273、rs2972162、rs3856806、rs4135247、rs4135275、rs709151、rs4135354、rs6805419、rs17036700、rs4135304),并在组间各个位点具有较高的重组率。LD分析结果显示,柯尔克孜健康对照组5个单体域的连锁不平衡系数(D′)=1,处于完全的连锁不平衡状态,不发生重组。柯尔克孜糖尿病组5个单体域的连锁不平衡系数D′=0.91,D′<1,说明两个位点间发生过重组。维吾尔健康对照组各4个单体域的连锁不平衡系数D′=1,处于完全的连锁不平衡状态,也说明此区域无重组热点。柯尔克孜族、维吾尔族PPARG重组热点图谱与HapMap图比较发现存在明显差异,在HapMap重组热点谱图中有6个重组热点,柯尔克孜族PPARG重组热点图谱最后5个SNP显示较低的重组率,而维吾尔族PPARG基因重组热点图谱中未发现重组热点。
在同一种族的糖尿病组与健康对照组或不同人群中在染色体某些区域的重组率变化可能存在很大差异,可能存在种群特异性的重组热点或同一热点位置的重组强度各不相同。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
真核生物减数分裂过程中基因组某些区域会发生较其他区域高的重组频率,这些区域被称作重组热点,近年来的研究表明"重组热点"是引发减数分裂重组活动的主要原因[1,2,3,4]。由于全基因组关联研究(genome-wide associated studies,GWAS)已成为目前识别严重危胁人类健康的常见复杂疾病(例如心血管病、某些肿瘤、糖尿病和自身免疫病等)致病位点的主要研究手段[5,6]。要使关联研究行之有效,就必须选择必要数量与恰当位点的遗传标记。这就要求我们了解人群中遗传标记的连锁不平衡(linkage disequilibrium, LD) 模式,而重组热点对LD模式的形成和基因组的变异有极大影响[7,8,9],并有助于在复杂疾病的关联研究中设计合理的研究策略,从而有效识别引起人类疾病及其对药物反应的遗传易感基因或变异位点,为临床疾病的诊治提供科学依据。因此,进行重组热点遗传定位对遗传流行病学研究具有重要理论与实际意义。新疆柯尔克孜族人群是我国特有的隔离人群资源,而目前未见此类人群重组热点遗传定位的相关研究报道,因此本项目拟结合现场调查与实验室研究,利用生物信息学手段分析种群多态性数据,构建新疆柯尔克孜族隔离人群的减数分裂重组热点图谱,旨在积累我国特有人群资源的遗传流行病学基础数据。
采用病例对照研究方法,在新疆克孜勒苏柯尔克孜自治州阿图什市哈拉峻乡人民医院协助下,由阿图什市哈拉峻乡人民医院统一提供的"居民健康档案资料"库中采集年龄≥45岁的柯尔克孜族2型糖尿病患者(糖尿病组,50例)和健康对照居民(健康对照组,50例)的血样和流行病学信息。取空腹静脉血约5 ml,血样采用非抗凝管和4 ml加乙二胺四乙酸(EDTA)二钾抗凝管收集,并与受检者签署知情同意书。入选对象为保持着无异族通婚史且彼此间无血缘关系的柯尔克孜族人群。
纳入在新疆地区民丰县医院体检的维吾尔族健康人群50例(维吾尔健康对照组),要求所有调查对象均在所在地区居住三代以上,无血缘关系,年龄≥45岁,家庭婚姻史为世代族内通婚。
DNA提取盒(EasyPure™ Blood Genomic DNA Kit,北京全式金生物技术有限公司);质谱分析仪(Mass ARRAY Compact System,美国Sequenom公司);基因扩增仪(Gene Amp 9700,美国ABI公司);质谱点样仪(Mass ARRAY Nanodispenser RS1000,美国Sequenom公司)。
采用EasyPure™ Blood Genomic DNA Kit试剂盒,分离出的DNA用琼脂糖凝胶电泳法检验,并通过紫外分光光度计检测吸光度(A)值,调整DNA终浓度在30~50 ng/μl之间。
根据单核苷酸多态性(SNP)位点利用Assay Design 3.1软件设计PCR引物和单碱基延伸引物。本项分析由毅新兴业(北京)科技有限公司利用美国Sequenom公司的Mass ARRAY系统完成,该系统是基于基质辅助激光解析电离飞行时间质谱技术(MALDI-TOF-MS)。Mass ARRAY TM Analyzer质谱检测,运行Mass ARRAY TM Typer 3.0.1软件进行数据分析,并输出各个位点基因多态性类型。
所有问卷统一编码,使用SPSS Data Entry 2.0软件建立数据库。所选SNP位点群体基因型经Hardy-Weinberg平衡检验。P>0.05说明所调查的群体达到遗传平衡。采用SNP遗传标记的种群多态性数据进行重组热点分析,运行Hotspot Fisher软件推测柯尔克孜族人群和维吾尔族人群的过氧化物酶体增殖物激活受体γ(PPARγ或PPARG)基因重组热点的位置、强度与宽度值。用Haploview软件进行LD分析。从HapMap网站(http://hapmap.org/index.html.en)下载尼日利亚约巴鲁人(YRI)、美国犹他州的欧洲西部和北部的后裔(CEU)、中国北京汉族人(CHB)+日本东京人(JPT)这3组人群对应染色体区的重组热点数据,用于比较穆斯林人群与非穆斯林人群重组热点模式的保守程度。
采用精确检验对对照组进行Hardy-Weinberg平衡检验,评估对照组的可靠性。结果显示PPARG基因入选的31个SNP位点中除了无多态性的rs4135329、rs4135356、rs4135354、rs6805419、rs9870196、rs17036700、rs4135304、rs4135343位点以外,其他23个位点均符合,表明本研究入选的研究对象具有良好的群体代表性。
PPARG基因所选的31个SNP位点进行基因分型,根据其30个SNP位点上发生的数据计算出种群重组率、每1 000碱基对出现的种群重组率和重组强度。从表1得知,除了柯尔克孜健康对照组(rs17036242、rs4135275、rs4684846、rs7626560、rs9310401、rs9817428、rs1801282、rs4135329、rs4135356、rs4135343)和糖尿病组(rs17036242、rs2921190、rs3856806、rs4684846、rs7626560、rs4135356、rs4135354、rs6805419、rs9870196、rs4135304)各10个SNP以及维吾尔健康对照组的9个SNP(rs17036242、rs2881654、rs4684846、rs6782475、rs7626560、rs9310401、rs4135329、rs4135356、rs9870196)之外,其余SNP位点都具有较高的重组率,重组强度都为0。PPARG基因重组率差异和重组强度相比较结果显示,3组人群均有18个标签单核苷酸多态性(tagSNP)相同(rs1151999、rs1175540、rs1875796、rs1899951、rs2292101、rs2921190、rs2938397、rs2959272、rs2959273、rs2972162、rs3856806、rs4135247、rs4135275、rs709151、rs4135354、rs6805419、rs17036700、rs4135304),并在组间各个位点具有较高的重组率。

各组PPARG基因30个SNP位点重组率特征
各组PPARG基因30个SNP位点重组率特征
| SNP ID | 染色体位置 | 柯尔克孜健康对照组 | 维吾尔健康对照组 | 柯尔克孜糖尿病组 | ||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 种群重组率 | 4Ner/kb | 重组强度 | 种群重组率 | 4Ner/kb | 重组强度 | 种群重组率 | 4Ner/kb | 重组强度 | ||
| rs1151999 | 12405654 | 36.675 | 0.014 | 0 | 17.496 | 0.134 | 0 | 83.682 | 0.019 | 0 |
| rs1175540 | 12423744 | 37.505 | 7.667 | 0 | 48.253 | 0.101 | 0 | 84.988 | 6.460 | 0 |
| rs17036242 | 12307991 | 0.439 | 0.018 | 0 | 0.994 | 0.081 | 0 | 0.187 | 0.019 | 0 |
| rs1875796 | 12402158 | 24.839 | 25.761 | 0 | 17.293 | 0.061 | 0 | 83.451 | 0.066 | 0 |
| rs1899951 | 12353341 | 13.925 | 0.097 | 0 | 13.007 | 0.026 | 0 | 55.791 | 0.159 | 0 |
| rs2292101 | 12393402 | 18.875 | 0.125 | 0 | 16.330 | 0.116 | 0 | 82.851 | 0.069 | 0 |
| rs2881654 | 12355456 | 2.512 | 3.151 | 0 | 2.080 | 0.023 | 0 | 52.406 | 0.031 | 0 |
| rs2921190 | 12377976 | 15.285 | 0.130 | 0 | 15.474 | 0.050 | 0 | 62.325 | 3.586 | 0.089 |
| rs2938397 | 12366779 | 14.717 | 0.051 | 0 | 13.775 | 0.152 | 0 | 56.974 | 0.478 | 0 |
| rs2959272 | 12401334 | 19.932 | 5.955 | 0 | 17.242 | 0.061 | 0 | 83.396 | 0.066 | 0 |
| rs2959273 | 12401232 | 19.852 | 0.782 | 0 | 17.236 | 0.061 | 0 | 83.39 | 0.066 | 0 |
| rs2972162 | 12383294 | 14.174 | 0.05 | 0 | 13.073 | 0.064 | 0 | 56.196 | 0.071 | 0 |
| rs3856806 | 12434058 | 15.975 | 0.499 | 0 | 15.742 | 0.035 | 0 | 81.393 | 0.207 | 0.188 |
| rs4135247 | 12355089 | 14.096 | 0.097 | 0 | 13.052 | 0.026 | 0 | 56.068 | 0.159 | 0 |
| rs4135275 | 12402345 | 29.657 | 2.121 | 5.348 | 17.304 | 0.058 | 0 | 83.463 | 0.066 | 0 |
| rs4684846 | 12297350 | 0 | 0.059 | 0 | 0 | 0.137 | 0 | 0 | 0.018 | 0 |
| rs6782475 | 12429831 | 36.786 | 0.095 | 0 | 47.957 | 0.029 | 0.142 | 83.833 | 0.151 | 0 |
| rs709151 | 12413500 | 14.034 | 0.097 | 0 | 13.036 | 0.026 | 0 | 55.968 | 0.159 | 0 |
| rs7626560 | 12433589 | 0.083 | 0.044 | 0 | 0.194 | 0.089 | 0 | 0.025 | 0.018 | 0 |
| rs9310401 | 12310969 | 1.471 | 0.272 | 0 | 1.992 | 0.023 | 0 | 52.234 | 0.045 | 0.083 |
| rs9817428 | 12298768 | 18.679 | 0.042 | 0.184 | 15.934 | 0.084 | 0 | 82.515 | 0.072 | 0 |
| rs1801282 | 12351626 | 55.676 | 3.884 | 0.422 | 48.492 | 0.118 | 0 | 100.298 | 53.823 | 0 |
| rs4135329 | 12388717 | 12.620 | 0.117 | 0.312 | 2.153 | 0.992 | 0 | 52.507 | 0.297 | 0 |
| rs4135356 | 12426114 | 0.374 | 0.025 | 0 | 0.783 | 0.082 | 0 | 0.142 | 0.018 | 0 |
| rs4135354 | 12420141 | 37.418 | 0.024 | 0 | 48.149 | 0.029 | 0 | 84.836 | 0.042 | 0.151 |
| rs6805419 | 12305412 | 59.614 | 0.052 | 0 | 48.612 | 0.118 | 0 | 154.874 | 1.201 | 0.986 |
| rs9870196 | 12342165 | 13.902 | 0.097 | 0 | 13.001 | 0.026 | 0.091 | 55.753 | 0.159 | 0.091 |
| rs17036700 | 12427128 | 36.686 | 0.014 | 0 | 17.605 | 4.314 | 0 | 83.697 | 0.019 | 0 |
| rs4135304 | 12353102 | 59.756 | 0.959 | 0 | 1.236 | 0.031 | 0 | 0.243 | 2.152 | 0 |
| rs4135343 | 12406465 | 0.491 | 0.041 | 0 | 48.930 | 0.118 | 0 | 158.120 | 0.059 | 0 |
注:SNP ID:SNP编号;4Ner/kb:每1 000个碱基对出现的种群重组率
用LD hat软件包的rhomap构建了3组人群的重组热点图谱。反向跳的多通道与多选择的软件迭代设置为10 000 000~20 000 000 bp。这些重组热点图谱总长度以HapMap重组热点图谱标准构建(图1,图2,图3,图4)。


柯尔克孜族、维吾尔族PPARG重组热点图谱与HapMap图(CEU,YRI,CHB+JPT)比较发现存在明显差异,在HapMap重组热点谱图有6个重组热点,柯尔克孜族PPARG重组热点图谱只有最后5个SNP显示较低的重组热点,而维吾尔族PPARG重组热点图谱中未发现重组热点(图1,图2,图3,图4)。
用Haploview软件计算成对发生的LD,过滤了<0.01的最小等位基因频率(MAF)位点或>0.25的丢失率后,剩余22个位点。22个SNP对应的位点分别在1个柯尔克孜糖尿病组和两个健康对照组的LD单体型块(Block)(图5)。


柯尔克孜健康对照组PPARG基因构建LD显示有5个LD单体型块。12297350、12298768为第1个单体型块,12307991、12310969为第2个单体型块, 12366779、12377976、12383294为第3个单体型块,12401232、12401334、12402158为第4个单体型块,12405654、12406465、12413500、12420141、12423744为第5个单体型块。当连锁不平衡系数(D′)为1,说明两个位点间存在完全连锁不平衡,无发生重组事件。
柯尔克孜糖尿病组PPARG基因构建LD显示有5个LD单体型块。12297350、12298768位点为第1个单体型块,12307991、12310969为第2个单体型块,12351626、12353102、12353341为第3个单体型块,12377976、12383294为第4个单体型块,12401334、12402158为第5个单体型块。当D′≥0.8时,表示两两位点存在强连锁不平衡,柯尔克孜糖尿病组25个位点分别位于5个单体型块,5个单体域的D′均为0.91,说明两个位点间发生过历史重组, LD完全被破坏。
维吾尔健康对照组PPARG基因构建LD显示有4个LD单体型块。12297350、12298768为第1个单体型块,12307991、12310969为第2个单体型块, 12377976、 12383294为第3个单体型块, 12401334、12402158为第4个单体型块。4个单体型块内的D′均为1,表示两个位点间存在完全连锁不平衡,未发生重组事件。
PPARG属于核激素受体超家族成员,基因位于3p25,全长146 484 bp,有9个外显子。已发现3种过氧化物酶体增殖物激活受体(PPAR)亚型,分别为PPARα、PPARβ、PPARγ。人类的PPARG基因主要表达于脂肪组织,调节脂肪细胞的分化过程,参与脂肪细胞的凋亡,PPARG基因功能缺失突变可以导致脂肪萎缩,所以脂肪细胞特异基因的表达和调节胰岛素敏感性方面发挥着重要作用[8,9,10,11,12]。至今虽然大量研究已经在不同种族报道了PPARG基因多态性方面的很多关联研究,但研究结果不一致,且研究位点多集中于少数几个常见SNP。
基因重组是生物多样性的基础,生物进化的动力,深挖关联基因易感位点或组合的出路所在。重组热点对LD模式的形成和基因组的变异有极大影响[13]。LD的存在,可以归因为两种因素:一是由突变产生的多态性而形成,二是由于重组的发生,呈现出两位点间的LD程度逐渐降低。由于分子标志物理距离的靠近,发生重组的概率降低,而呈现出高LD的表现。 理论上LD强度与2个SNP间的距离有关,距离越小发生重组机会越小→LD强;距离越大发生重组机会越大→重组率大→LD弱[14]。
本研究结果显示,除了柯尔克孜健康对照组10个SNP(rs17036242、rs4135275、rs4684846、rs7626560、rs9310401、rs9817428、rs1801282、rs4135329、rs4135356、rs4135343)和糖尿病组10个SNP(rs17036242、rs2921190、rs3856806、rs4684846、rs7626560、rs4135356、rs4135354、rs6805419、rs9870196、rs4135304)及维吾尔健康对照组9个SNP(rs17036242、rs2881654、rs4684846、rs6782475、rs7626560、rs9310401、rs4135329、rs4135356、rs9870196)之外,其余的SNP位点具有较高的重组率,重组强度都为0。以上结果可以得知,不同人群中在染色体某些区域的同一位点发生的重组率变化或同一热点位置的重组强度各不相同,且一个种族不同的两组间在染色体某些区域的同一位点发生的重组率变化或同一热点位置的重组强度各不相同。
在PPARG基因HapMap重组热点图谱研究中发现6个重组热点,但研究所构建的PPARG基因重组热点图谱同样的区域内没有发现重组热点。柯尔克孜健康对照组和糖尿病组的重组热点图谱内最后5个SNP位点显示较低的重组热点,而维吾尔族重热点图谱中未发现。我们的模式图与HapMap重组模式图之间存在的差异可能是由于较低的标记密度和边界效应所致,较低的标记密度可能没有捕捉所有的重组信息,并且本软件在染色体的起端和末端未能给出很好的估计。柯尔克孜糖尿病组和健康对照组与维吾尔健康对照组PPARG基因LD图谱比较发现,3个人群均有8个tagSNP相同(12297350、12298768、12307991、12310969、12377976、12383294、12401334和12402158)。
本研究还发现,将HapMap重组热点图谱中的6个重组热点放在柯尔克孜糖尿病组、健康对照组和维吾尔健康对照组的LD图谱上相比较存在明显差异,6个重组热点位置都在单体型块之间,这表明柯尔克孜和维吾尔人群PPARG基因相同区域在历史上发生过许多重组事件。因为染色体传递中同源片段发生重组,多代之后祖先染色体片段的原有排布已被打乱,染色体形成没有发生重组的区域被重组区域相互隔开,这些不发生或少发生重组的区域称为单体型块,重组区域称为重组热点。
另外,人口史和自然选择也可以导致这些LD模式改变。正如我们所知,HapMap重组热点图谱的建立基于CEU、YRI和CHB+JPT,目前缺乏中国西北人群的重组热点,有待研究。本研究进一步提示,在特定人群中进一步系统挖出候选基因重组热点相关的SNP,并基于人群特异性的SNP数据进行遗传学关联研究有其特殊意义。
总之,本研究较为系统全面地建立了新疆柯尔克糖尿病组、健康对照组和维吾尔健康对照组PPARG基因遗传多态性和重组热点图谱,同时发现HapMap重组热点图谱与3组新构建重组热点图谱间的差异。由于PPARG在多种复杂性疾病的发病机制中具有重要的作用,其基因多态性与疾病易感性已越来越受到重视。然而不同人群间PPARG基因重组热点频率分布存在较大差异,选择其他种族人群中已发现的高重组热点位点(高风险位点)在中国新疆维吾尔族、柯尔克孜族等少数民族人群中进行研究欠妥当。本研究通过对新疆柯尔克孜族糖尿病人群和健康人群及维吾尔族健康人群PPARG基因重组热点遗传定位和LD图谱研究,为在柯尔克孜族和维吾尔族人群中开展PPARG基因遗传多态性,疾病易感性与疾病预后研究,药物基因组学研究乃至分子进化研究奠定了基础。





















