
近年来转录组测序(RNA-seq)技术的成熟和推广应用,为直接测序和鉴定各种可能发生的融合转录本提供了强大工具。随着大宗病例RNA-seq研究报道的增多,血液肿瘤中融合基因的真实图谱日渐清晰。文章结合第62届美国血液学会年会的报道对相关研究进展进行介绍。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
融合基因是两个基因的转录本发生异常拼接的产物,已被作为血液肿瘤分子分型的依据,具有重要的预后判断和指导治疗方案选择的意义,还可作为高灵敏度的微小残留病(MRD)监测指标,其中较为常见的数十种融合基因已成为血液肿瘤临床常规的检测指标[1,2]。既往融合基因的发现依赖于先发现染色体核型异常,再定位和寻找可能发生断裂和异常拼接的基因。这种模式不能发现隐匿性染色体易位或微缺失导致的融合基因,也难以鉴定单个少见但总数可能并不少的融合基因[3,4]。近年来,高通量基因测序尤其是转录组测序(RNA-seq)技术的成熟和推广应用,为直接测序和鉴定所有可能发生的融合转录本提供了强大的工具,血液肿瘤中新融合基因的报道迅速增多[5,6,7]。在2020年的第62届美国血液学会(ASH)年会上,也有多项相关报道。
目前,用RNA-seq分析融合基因时,一份典型的测序数据包括数千万的测序片段和10亿数量级的碱基序列数,而用来确定特定融合基因的序列仅数十个碱基[8]。大量的背景基因序列为分析融合基因带来挑战。目前在分析血液肿瘤融合基因时,多结合使用2~3种信息分析软件(如Arriba、STAR-Fusion、Manta、FusionCatcher、SOAPfuse、JAFFA等),保留高度可信的框内融合序列作为可疑的致病融合基因候选[8,9]。这些融合转录本可能仅仅是染色体随机断裂和拼接的副产物,并非都具有重要的生物学意义。已经熟知的具有病理意义的融合基因以及虽少见但具有病理意义的融合基因只占RNA-seq和生物信息分析所得结果的一小部分。因此对于生物信息分析后保留的各种融合转录本,还需进一步结合其所累及的基因的功能、基因结构、在疾病中的发生情况及已有的文献和知识进行综合分析,以判断其可能的病理意义。
当前对于RNA-seq测得的融合转录本的病理意义分析尚无统一的标准和指南。在第62届ASH年会上,陆道培医院报道了他们对融合转录本的分类规则,即根据所涉及基因和文献报道或数据库信息将融合基因分为4大类:A类为根据文献资料可明确其病理意义的融合基因;B类为参考文献资料和相关数据库信息判断为高度可疑致病的融合基因;C类为所涉及的两个基因均未见于文献或数据库报道,目前无法判断其病理意义的融合基因;D类为见于正常对照样本,或根据融合的结构、功能和共现性等推测为非致病的融合基因[10,11]。融合基因的病理意义与所累及基因的功能和重现性有密切关系,所有对于新发现和(或)尚无功能验证的融合转录本的分析都是基于当前认识的有限评估,具有一定的局限性。RNA-seq为发现和研究新的具有病理意义的融合基因提供了有效工具,而不断丰富的知识库可为更准确评估新鉴定融合基因的病理意义提供参考。
随着测序技术的成熟和测序成本的下降,对大宗病例进行RNA-seq的研究报道越来越多,血液肿瘤中融合基因的真实图景日渐清晰。既往研究显示,血液肿瘤中融合基因的分布呈显著的长尾现象和一定程度的家族聚集现象[3,4]。长尾现象是指存在单个阳性率很低但数目众多的融合基因,这些融合基因的总阳性率并不低,具有重要的临床诊疗意义。家族聚集现象指某些融合基因有共同的伙伴基因,如JAK2可与多种基因发生融合,具有共同的致病机制。"融合基因家族(FG-FM)"的概念有助于归类和理解融合基因的致病机制、推测新鉴定的融合基因的病理意义[3]。
第62届ASH年会上,Haferlach等[8]报道了对涉及25种血液肿瘤亚型的3 549例患者进行RNA-seq分析融合基因的研究结果。在932例(26.3%)患者中检测到806种不同融合基因,50种融合基因具有重现性,756种融合基因分别仅在1例患者中检出,融合基因的分布呈现出典型的长尾特征。少见型融合基因的鉴定也可能有重要的临床预后和治疗指导意义。Haferlach等[8]报道的重现性融合基因中,4种累及的基因有已获批准上市的靶向药可用,在单个少见的融合基因中,32种所累及的基因有已获批准上市的靶向药可用。该研究共发现199个可与多个伙伴基因发生融合的基因,包括ETV6、KMT2A、RUNX1和ABL1等。考虑到融合基因的家族聚集现象(如所有携带ABL1-FM的患者都可能获益于ABL1激酶抑制剂),可能获益于靶向药的患者数量应显著多于所报告的累及基因数。陆道培医院报道了应用RNA-seq对成年人和儿童急性髓系白血病(AML)及急性淋巴细胞白血病(ALL)患者进行融合基因分析的研究结果[10,11]。AML中融合基因阳性率为61%,47%的融合基因可归类于RUNX1-FM、KMT2A-FM、NUP98-FM等18个融合基因家族;ALL中融合基因阳性率为59%,53%的融合基因可归类于ABL1-FM、ETV6-FM、ZNF384-FM、KMT2A-FM和MEF2D-FM等17个融合基因家族;所有AML和ALL患者均做了41种常规融合基因筛查检测,阳性率分别为42%和30%。该数据显示RNA-seq可显著提高融合基因的阳性率,在更多的急性白血病患者中鉴定出具有诊疗指导意义的融合基因。上海儿童医学中心关于儿童AML的RNA-seq研究显示,融合基因的阳性率为69.5%[12]。福建协和医院对成年人和儿童ALL进行融合基因分析的阳性率分别为60.9%和27.2%[13]。不同研究中融合基因阳性率受患者年龄、病种、纳入标准等多种因素影响,因此更需要多中心的大宗病例报道,才能综合反映各年龄段、各种血液肿瘤中融合基因分布的真实特征。
通过RNA-seq还发现多种发生率并不低但因对应的核型异常隐匿而长期未被鉴定的融合基因或融合基因家族。有文献报道儿童AML中NUP98-NSD1阳性率5%~10%,但因为这两个基因分别位于11号染色体短臂末端和5号染色体长臂末端,对应的核型异常不易被发现而长期被忽视[12,14,15]。第62届ASH年会中,Bertrums等[15]报道在2 396例儿童AML患者中发现164例有NUP98-FM,其中NUP98-NSD1 110例、NUP98-KDM5A 34例,另20例分别与HOXA9、HOXD13、PHF15等13个基因发生融合。Smith等[14]报告的NUP98-FM的融合基因分布特征与之相近。
在筛查数十种血液肿瘤中相对多见的融合基因时,很少有两个融合基因同时阳性。回顾性分析8 226例急性白血病患者的36种融合基因筛查结果,仅25例(0.3%)同时检测到两种融合基因阳性[16]。RNA-seq分析融合基因时,两种或更多融合基因同时阳性的发生率显著升高。Haferlach等[8]在3 549例血液肿瘤患者中发现150例有两种融合基因同时阳性,36例有三种融合基因同时阳性,另35例有更多融合基因同时阳性。在陆道培医院的报告中,AML和ALL中两种或更多种融合基因同时阳性的发生率均为9%[10,11]。更全面的分析导致多种融合基因同时阳性的发生率显著升高,这些融合基因共同发生或在疾病过程中先后出现的规律,以及它们之间可能存在的协同致病机制,尚待进一步研究。
RNA-seq可获得样本中几乎所有的转录本序列,结合生物信息分析软件,可有效鉴定出绝大多数可能存在的常见和少见型融合转录本,并直接从基因序列层面确定常见和少见型的融合基因(如BCR-ABL1 e1a2、e13a2等)。RNA-seq数据中还有丰富的基因表达量、转录本异构体、基因序列变异等信息,为分析融合基因与基因突变、基因表达异常的关联性提供了数据基础,有助于更全面地揭示疾病发生的分子机制,更准确和合理地对血液肿瘤进行分子分型。
RNA-seq为非靶向测序,具有大量的背景基因序列,难以实现高灵敏度的融合基因分析,更不能用于MRD监测。相对表达量较低的融合转录本(如KMT2A-FM等)的有效检出对肿瘤细胞比例要求更高。对于一些转录本的拼接位点在非编译区的融合基因(如STIL-TAL1等),需要注意生物信息分析软件的设置,以避免漏检。亦应注意并非所有的染色体/基因易位都有融合转录本形成,如约50%的t(12;22)(p13;q12)患者形成MN1-ETV6融合转录本,另一半有该易位的患者同样存在ETV6缺陷和MN1过表达,但并无MN1-ETV6融合转录本生成[5]。
RNA-seq提供了分析和描绘血液肿瘤中真实存在的融合基因全景图的可能。随着对新发现的和尚无功能验证的融合基因病理意义分析能力的提升和知识库的不断丰富,血液肿瘤中融合基因的真实图谱会越来越清晰,并可联合基因表达异常、基因突变和基因异常剪接,更全面地揭示肿瘤发生的分子机制,从而更准确地对血液肿瘤进行分子分型。
所有作者均声明不存在利益冲突





















