论著
采用生物信息学方法筛选和分析滤泡性淋巴瘤关键基因
白血病·淋巴瘤, 2020,29(11) : 655-659. DOI: 10.3760/cma.j.cn115356-20200601-00148
摘要
目的

采用基因表达汇编(GEO)数据库中转录组数据筛选和分析滤泡性淋巴瘤的关键基因。

方法

通过GEO数据库收集转录组数据集GSE32018和GSE55267。使用R软件行差异分析,筛选差异表达基因,FunRich 3.13软件分析共同差异基因,Cytoscape 3.7.2软件进行滤泡性淋巴瘤相关生物过程和通路分析,筛选与滤泡性淋巴瘤相关的潜在基因,通过分析Oncomine数据库的临床数据进行生存分析,验证所筛选的差异基因。

结果

通过对GSE32018和GSE55267数据集的差异分析,确定141个上调基因和199个下调基因,其中筛选出12个关键基因,即CXCL8、KRT19、CYCS、CDKN3、SFN、RRM2、FN1、APOE、CXCL12、VWF、GATA3、TIMP1,其中CYCS、CXCL8和CXCL12与患者早期生存率的关联最为明显。CXCL12过表达和CYCS低表达与患者不良预后相关;CXCL8在淋巴瘤组织中表达下降,但生存分析中其相对高表达患者出现总生存期缩短的现象,可能与滤泡性淋巴瘤早期发展相关。筛选出GO、KEGG及Reactome通路,分别为GO:0001892、KEGG:04115、R-HSA:2559582、GO:0060968、R-HSA:6785807、GO:0043627、GO:0001936、GO:0043062。

结论

筛选出的基因CYCS、CXCL8和CXCL12可能为滤泡性淋巴瘤的治疗研究提供更有效的生物标志物。

引用本文: 刘芳芳, 张厦栋, 阎克里, 等.  采用生物信息学方法筛选和分析滤泡性淋巴瘤关键基因 [J] . 白血病·淋巴瘤, 2020, 29(11) : 655-659. DOI: 10.3760/cma.j.cn115356-20200601-00148.
参考文献导出:   Endnote    NoteExpress    RefWorks    NoteFirst    医学文献王
扫  描  看  全  文

正文
作者信息
基金 0  关键词  0
English Abstract
评论
阅读 0  评论  0
相关资源
引用 | 论文 | 视频

版权归中华医学会所有。

未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。

除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。

滤泡性淋巴瘤(FL)是非霍奇金淋巴瘤(NHL)最常见的类型之一,在欧美地区占NHL的20%~30%,在亚洲地区发病率较低,不足NHL的10%[1]。虽然FL临床表现为惰性,但绝大多数患者很难治愈。其病理诊断表现为滤泡中心细胞和中心母细胞的增生,多为滤泡样结节状生长。FL在临床和遗传学方面具有异质性。我们采用生物信息学方法,通过分析基因表达汇编(GEO)数据库公共数据集中FL基因芯片数据集,筛选出FL患者异常表达的基因,探索与FL相关的生物过程和生物通路,寻找FL潜在的生物标志物和分子靶标。

1 资料与方法
1.1 数据来源

两组基因表达谱数据集包括GSE32018和GSE55267,数据集均从NCBI-GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)获得。GSE32018数据集平台为GPL6480Agilent-014850 Whole Human Genome Microarray 4x44K G4112F(Probe Name version),GSE55267数据集平台为GPL570[HG-U133_Plus_2] Affymetrix Human Genome U133 Plus 2.0 Array。GSE32018数据集包括6例正常反应性扁桃体样本和23例FL患者新鲜冷冻淋巴结样本。GSE55267数据集包括4例正常反应性扁桃体纯化的生发中心细胞和63例FL患者淋巴结活检组织。

1.2 差异表达基因的筛选

所得数据集矩阵均使用R3.5.1软件读取处理。所得数据集在分组后均使用limma3.38.3软件包的normalize Between Arrays函数校正。利用limma 3.38.3软件包对两组数据集分别进行显著差异表达基因筛选,筛选阈值为P<0.01且| log2倍数变化|>1。所得差异表达基因使用ggplot2作图展示。比较两组显著差异表达的基因集合,通过FunRich 3.1.3软件选取两数据集中差异表达基因的交集。

1.3 蛋白质相互作用网络(PPI network)的构建及关键基因的筛选

通过Cytoscape 3.7软件cytohubba插件的12种算法筛选关键基因。并使用STRING数据库(https://string-db.org/)对差异表达基因进行蛋白质网络分析。

1.4 差异表达基因的功能富集分析

采用Cytoscape 3.7.2软件clueGO程序对所确定差异表达基因进行基因本体(GO)、KEGG通路以及Reactome通路富集分析,选取P<0.05作为显著富集相关的阈值。通过对富集通路的分组,网络筛选每组最显著的生物通路。

1.5 生存分析

通过Oncomine数据库(https://www.oncomine.org)的"Follicular Lymphoma"项的Dave Lymphoma数据获取FL患者的临床信息,采用GraphPad Prism 8软件绘制Kaplan-Meier生存曲线,并行log-rank检验。

2 结果
2.1 差异表达基因的筛选结果

分析GSE32018和GSE55267两个芯片数据,得到141个上调基因和199个下调基因(图1)。

点击查看大图
图1
滤泡性淋巴瘤GSE32018和GSE55267数据集对照正常组织差异表达基因筛选结果 1A:GSE32018数据集差异表达基因火山图;1B:GSE55267数据集差异表达基因火山图;1C:GSE32018和GSE55267数据集中上调和下调基因数量关系韦恩图
点击查看大图
图1
滤泡性淋巴瘤GSE32018和GSE55267数据集对照正常组织差异表达基因筛选结果 1A:GSE32018数据集差异表达基因火山图;1B:GSE55267数据集差异表达基因火山图;1C:GSE32018和GSE55267数据集中上调和下调基因数量关系韦恩图
2.2 关键基因的筛选结果

通过Cytoscape软件cytohubba插件每种算法选取得分最高的10个基因为关键基因(表1)。各差异表达基因蛋白质网络见图2

点击查看大图
图2
通过STRING数据库得到滤泡性淋巴瘤差异表达基因的蛋白质相互作用网络
点击查看大图

注:节点的面积随连通度减小而缩小,节点颜色随连通度减小由红色转变为绿色

图2
通过STRING数据库得到滤泡性淋巴瘤差异表达基因的蛋白质相互作用网络
点击查看表格
表1

通过cytohubba插件的12种算法筛选滤泡性淋巴瘤排名前10位关键基因的结果

表1

通过cytohubba插件的12种算法筛选滤泡性淋巴瘤排名前10位关键基因的结果

计算方法关键基因
BetweennessFN1CXCL8CYCSKRT19VWFTHY1GATA3APOESFNPI3
BottleNeckFN1CXCL8CYCSKRT19THY1APOECDKN3S100A7SERPINB5LCN2
ClosenessFN1CXCL8THY1CXCL12CYCSKRT19TIMP1APOEVWFC3
DegreeFN1CXCL8CXCL12TIMP1MAD2L1THY1C3KRT19KRT5CDKN3
EPCFN1CXCL8CXCL12C3TIMP1THY1CCL20APOEKRT14FSTL1
MNCFN1CXCL8CXCL12TIMP1THY1C3KRT5MAD2L1CHEK1KRT19
RadialityFN1CXCL8CYCSTHY1PI3APOECXCL12VWFHSPD1GATA3
StressFN1CXCL8KRT19CYCSSFNPI3THY1GATA3S100A7VWF
MCCMAD2L1PBKKIAA0101ZWINTNCAPGRRM2HMMROIP5CDKN3NUF2
DMNCMND1FANCIHMGB2HMMRZWINTNCAPGPBKRRM2KIAA0101KRT24
EcCentricitySCDCYCSAPOECXCL8FN1LPLGATA3HSPD1HTRA1PI3
ClusteringCoefficientCEACAM7MND1TMEM30BAPOC1RSPO3WTAPFZD5IL32IFI27ZBTB32
2.3 GO、KEGG及Reactome通路富集分析结果

将141个上调基因和199个下调基因分别输入clueGO插件,分别得到69个和47个富集通路。将筛选的关键基因与筛选的富集生物通路联合分析,得到FL相关关键基因、生物过程和通路(表2表3)。筛选出12个关键基因,即CXCL8、KRT19、CYCS、CDKN3、SFN、RRM2、FN1、APOE、CXCL12、VWF、GATA3、TIMP1,其中CYCS、CXCL8和CXCL12与患者早期生存率的关联最为明显。CXCL12过表达和CYCS低表达与患者不良预后相关;CXCL8在淋巴瘤组织中表达下降,但生存分析中其相对高表达患者出现总生存期缩短的现象,可能与滤泡性淋巴瘤早期发展相关。

点击查看表格
表2

滤泡性淋巴瘤GSE32018和GSE55267数据集中上调基因相关的核心生物过程及通路

表2

滤泡性淋巴瘤GSE32018和GSE55267数据集中上调基因相关的核心生物过程及通路

基因序列号生物学功能分级P分组P相关基因
R - HSA:6785807白细胞介素4和白细胞介素13信号转导0.0010.001COL1A2、FN1a、GATA3a、IL6R、TIMP1a
GO:0043627雌激素反应0.0010.001FSTL1、GATA3a、GATA6、TIMP1a、TNFRSF11B
GO:0001936内皮细胞增殖的调节<0.01<0.01ACVRL1、APOEa、CDH11、CXCL12a、DYSF、NR2F2、SULF1、VEGFC
GO:0043062细胞外组织结构<0.01<0.01A2M、APOC1、 APOEa、CETP、COL12A1、COL1A2、COL4A1、COL4A2、COL6A3、CST3、CYP1B1、FN1a、HTRA1、LPL、MYH11、SMOC2、SULF1、TIMP1a、TNC、TNFRSF11B、 VWFa

注:a关键基因

点击查看表格
表3

滤泡性淋巴瘤GSE32018和GSE55267数据集中下调基因相关的核心生物过程及通路

表3

滤泡性淋巴瘤GSE32018和GSE55267数据集中下调基因相关的核心生物过程及通路

基因序列号生物学功能分级P分组P相关基因
GO:0001892胚胎胎盘发育<0.01<0.01CDKN3a、E2F8、FZD5、GJB5、HERPUD1、JUNB、KRT19a
KEGG:04115p53信号通路0.0010.001CHEK1、 CYCSa、RRM2a、SERPINB5、 SFNa
R-HSA:2559582衰老相关分泌表型(SASP)0.0040.004CDKN2B、CXCL8a、HIST1H3A、HIST1H4L、IL1A
GO:0060968基因沉默的调控<0.010.001AICDA、CD69、CDKN3a、EIF4E、HIST1H3A、HIST1H4L、NDC1、RNASE7

注:a关键基因

2.4 生存分析结果

Oncomine数据库"Follicular Lymphoma"项的Dave Lymphoma数据包含191例FL患者的生存信息,去除无效数据及偏离的异常数据,按关键基因的表达高低分组,分析患者3年生存情况,结果显示CYCS、CXCL8和CXCL12三个基因不同表达水平的患者间总生存差异有统计学意义(P值分别为0.027、0.029、0.029)(图3)。

点击查看大图
图3
采用生物信息学筛选的Oncomine数据库中3个差异表达基因不同表达水平的滤泡性淋巴瘤患者间总生存曲线比较 3A:CYCS基因;3B:CXCL8基因;3C:CXCL12基因
点击查看大图
图3
采用生物信息学筛选的Oncomine数据库中3个差异表达基因不同表达水平的滤泡性淋巴瘤患者间总生存曲线比较 3A:CYCS基因;3B:CXCL8基因;3C:CXCL12基因
3 讨论

随着现代医疗技术和生物技术的发展,越来越多的基础和临床研究致力于发现FL的潜在机制,为FL的诊断和治疗提供了更多可能。但目前大多数研究主要集中在单基因事件上。Ma等[2]通过生物信息学分析鉴定CXCR4为多形性成胶质细胞瘤的潜在生物标志物,并发现CXCR4低表达可能提示患者的总生存较好。

本研究整合不同时期和不同国家的两个FL转录组基因芯片数据集,利用生物信息学方法全面分析,确定了340个重叠的差异表达基因,包括141个上调基因和199个下调基因。通路富集分析及蛋白质网络分析表明,差异表达基因主要参与GO:0001892、KEGG:04115、R-HSA:2559582、GO:0060968、R-HSA:6785807、GO:0043627、GO:0001936、GO:0043062过程的调控,为FL发生、发展的分子机制研究提供了新见解,并确定了其可能是FL潜在治疗或诊断靶点的关键基因。我们还使用Oncomine数据库的临床数据对这些基因进行了验证,筛选出12个关键基因,即CXCL8、KRT19、CYCS、CDKN3、SFN、RRM2、FN1、APOE、CXCL12、VWF、GATA3、TIMP1,其中CYCS、CXCL8和CXCL12与患者早期总生存的关联最为明显。

CXCL12基因编码的蛋白属于α趋化因子家族成员,是G蛋白偶联受体的配体,在许多不同的细胞功能中发挥作用,包括胚胎发生、免疫监视、炎症反应、组织稳态以及肿瘤生长和转移。相关研究发现CXCL12可增强淋巴瘤细胞的运动能力[3,4,5],认为CXCL12基因可作为FL潜在的治疗靶标[6]。CYCS基因编码一种血红蛋白,它是线粒体电子传递链的重要组成部分。目前对CYCS的研究多集中在与血小板减少相关的疾病中,尚鲜见CYCS在FL中作用的报道。我们的研究表明,CYCS作为p53信号通路的组成基因,可能与FL有关。FL组织中CYCS的表达低于正常组织,并且CYCS低表达的患者预后不良,有可能是FL潜在的生物标志物。CXCL8基因编码的蛋白质是CXC趋化因子家族的成员,是炎症反应的主要介质,与CXCL8相关的疾病包括黑色素瘤和成年人呼吸窘迫综合征。CXCL8作为一种重要的多功能细胞因子,以自分泌或旁分泌方式调节肿瘤的增殖、侵袭和迁移[7],与弥漫大B细胞淋巴瘤的进展有关[8]。我们在分析GEO芯片数据集和临床数据时发现,CXCL8在淋巴瘤组织中表达下降,但生存分析时其高表达患者却出现总生存期缩短的现象,表明可能与该基因在FL早期表达相关,而其在FL发展过程中变化不明显。

由于FL为惰性淋巴瘤,患者中位总生存时间可以达到8~10年,总生存时间个体差异很大,并且随着疾病的发展以及多种治疗手段的介入,基因与FL的关系会因多种因素的影响而无法正确表现出来。研究表明早期FL具有独特的分子和遗传学特征[9],不同时期FL的基因表达存在差异[10]。所以在生存分析部分,我们去除了偏离较大的异常数据,将观察时间限制在3年,以便更有效地发现与FL形成相关的基因。单一的生物标志物或途径不足以解释肿瘤的发生机制,致癌作用有着复杂的分子机制[11,12]。我们从差异表达基因中鉴定出CYCS、CXCL8和CXCL12三个基因。生存分析发现CXCL12过表达和CYCS低表达与FL的不良预后相关;CXCL8在淋巴瘤组织中表达下降,而生存分析中其相对高表达患者出现总生存期缩短的现象,可能与FL早期发展相关。这种多基因组合的分析可能为FL的研究提供更有效的生物标志物。

利益冲突
利益冲突

所有作者均声明不存在利益冲突

参考文献
[1]
中华人民共和国国家卫生健康委员会.淋巴瘤诊疗规范(2018年版)[J].肿瘤综合治疗电子杂志20195(4):50-71. DOI:10.12151/JMCM.2019.04-11.
National Health and Health Commission of the People's Republic of China. Standard for diagnosis and treatment of lyphoma(2018)[J]. Journal of Multidisciplinary Cancer Management(Electronic Version),20195(4):50-71. DOI:10.12151/JMCM.2019.04-11.
[2]
MaXShangFZhuWet al. CXCR4 expression varies significantly among different subtypes of glioblastoma multiforme(GBM)and its low expression or hypermethylation might predict favorable overall survival[J]. Expert Rev Neurother201717(9):941-946. DOI:10.1080/14737175.2017.1351299.
[3]
ZhouQHuangLGuYet al. The expression of CCL18 in diffuse large B cell lymphoma and its mechanism research[J]. Cancer Biomark201821(4):925-934. DOI:10.3233/CBM-171097.
[4]
MazurGButrymAKryczekIet al. Decreased expression of CXCR4 chemokine receptor in bone marrow after chemotherapy in patients with non-Hodgkin lymphomas is a good prognostic factor[J]. PLoS One20149(5):e98194. DOI:10.1371/journal.pone.0098194.
[5]
CorcioneAOttonelloLTortolinaGet al. Stromal cell-derived factor-1 as a chemoattractant for follicular center lymphoma B cells[J]. J Natl Cancer Inst200092(8):628-635. DOI:10.1093/jnci/92.8.628.
[6]
DürigJSchmückerUDührsenU. Differential expression of chemokine receptors in B cell malignancies[J]. Leukemia200115(5):752-756. DOI:10.1038/sj.leu.2402107.
[7]
PandeySMourcinFMarchandTet al. IL-4/CXCL12 loop is a key regulator of lymphoid stroma function in follicular lymphoma[J]. Blood2017129(18):2507-2518. DOI:10.1182/blood-2016-08-737239.
[8]
LiuQLiATianYet al. The CXCL8-CXCR1/2 pathways in cancer[J]. Cytokine Growth Factor Rev20163161-71. DOI:10.1016/j.cytogfr.2016.08.002.
[9]
ManfroiBMcKeeTMayolJFet al. CXCL-8/IL8 produced by diffuse large B-cell lymphomas recruits neutrophils expressing a proliferation-inducing ligand APRIL[J]. Cancer Res201777(5):1097-1107. DOI:10.1158/0008-5472.CAN-16-0786.
[10]
MamessierESongJYEberleFCet al. Early lesions of follicular lymphoma:a genetic perspective[J]. Haematologica201499(3):481-488. DOI:10.3324/haematol.2013.094474.
[11]
StaigerAMHosterEJurinovicVet al. Localized- and advanced-stage follicular lymphomas differ in their gene expression profiles[J]. Blood2020135(3):181-190. DOI:10.1182/blood.2019000560.
[12]
ZengTSunSYWangYet al. Network biomarkers reveal dysfunctional gene regulations during disease progression[J]. FEBS J2013280(22):5682-5695. DOI:10.1111/febs.12536.
 
 
展开/关闭提纲
查看图表详情
回到顶部
放大字体
缩小字体
标签
关键词