首页->新闻动态

首次对近9000例癌症患者分析发现: 细胞转化成肿瘤竟然有个“开关”!

  日期:2018-04-10  来源:测序中国



随着新技术的发展,尤其是高通量测序技术的出现,使得研究者的目光越来越多地聚焦到基因组上非编码基因序列上,它们对生物发育、疾病产生及发展起重要作用。


4月5日,国际著名学术杂志《细胞》在线上发表一篇来自MD Anderson梁晗团队的文章显示,通过首次大规模研究来自33个癌种8928个癌症病人样品中增强子的表达,发现大部分癌种中都大量存在着表达的增强子,为泛癌种中提供了增强子表达的全景描述。同时,发现增强子表达与非整倍体变异成正相关。


近日,梁晗在《细胞》上为美国癌症基因组项目(TCGA)泛癌分析的所做的前沿专访中表示:“通过TCGA项目,很多新的遗传因子在癌症发展中作用逐渐被揭示,包括非编码区。同时,通过癌症多重组学分析,生物信息和计算生物工作者已经成为癌症研究的主力军。“


据介绍,在癌细胞中,调控网络通常会“重新布线”导致癌症,但对这种重新布线的发生研究有限。研究小组揭示了增强子作为拼图游戏的一个组成部分,表明增强子是包括程序性死亡配体-1(PD-L1)在内重要治疗靶标的关键调节因子。


PD-L1是抑制免疫系统的因子,促进癌症形成和生长,是许多现有和新兴免疫疗法的关键靶点。使用来自癌症基因组图谱(TCGA)的RNA测序数据,梁晗团队对33种癌症类型的8,928个肿瘤样品进行了大规模分析,并鉴定出相当数量的增强子,包括PD-L1的增强子9。


“我们的研究系统地鉴定了不同肿瘤中增强子活性,提出了抑制关键治疗靶点新的策略,”梁晗说,他们还发现增强子可以作为生物标志物,通过检查靶向脾酪氨酸激酶(SYK)的增强子22,其与多种类型的晚期癌症相关。结合患者的生存期,他们发现增强子22的高表达是多种癌症类型预后差的标志。


基于对TCGA数据的分析,梁晗团队提出一个模型,即染色质可能是某些增强子激活过程的关键贡献者,它提供了基因突变和克隆如何演化为某些癌症的解释。


“单个肿瘤祖细胞染色质结构的变化可能会在肿瘤细胞生长过程中积累产生显着的差异。染色质结构可被突变的组蛋白进行重塑,这在癌症中经常见到。”梁晗说,他们观察到了增强子在癌症基因组中的“开”和“关”,为细胞如何一步步转化成肿瘤提供了新的观点。


当然,梁晗团队的分析只是揭示了许多与癌症基因相关的增强子,后续还需要更多的努力,来进一步研究增强子在临床应用中的潜力。


下面就是这个精彩的研究:


激活的增强子所在DNA位置上的核小体打开,利于转录因子和RNA聚合酶的结合,从而导致增强子进行双向转录,即检测增强子的表达就可以鉴定增强子的激活状态。基于这样一个原理,研究者首先探索TCGA RNA-seq数据用于增强子表达分析的可行性:FANTOM数据库~65000个增强子中的15808 个有可能同过TCGA RNA-seq检测到。通过进一步的增强子特征分析,发现鉴定的增强子明显差异于其他基因的转录信号,比如编码基因、lncRNA,这样确定了TCGA RNA-seq数据可用于增强子分析。在15808个增强子中,很多在33个癌种的8928个样品中都有reads能特异性地回帖到这些增强子上,通过更严格的过滤,最后平均每种癌症鉴定出4591个,而这些增强子中有相当一部分与预后相关。不同癌种中增强子表达情况呈现巨大差异,最低的是肝细胞癌,最高的是胸腺瘤。


相关性分析发现,在大部分癌种中,增强子的激活与非整倍体变异成正相关,而与突变负荷无关或者负相关。用1500个增强子进行聚类,增强子被分为3类:C1组富集高突变负荷和低水平非整倍体变异样品,C2组富集高突变负荷和高水平非整倍体变异样品,C3组富集低突变负荷和低水平非整倍体变异样品。


前面的研究提出了一个有趣的问题:为何非整倍体变异和突变负荷与增强子激活相关性不一致?已有研究发现低突变率是开放DNA区域的一个特征,而开放的DNA更容易产生结构变异,如非整倍体变异。为进一步证实这个结论,研究者计算发现,开放的DNA区域与较高的DNA双链断裂发生率和较低的突变率相关,封闭的染色质则相反。Hi-C数据分析也证实了这一结论。这一假设模型为何整倍体变异和突变负荷与增强子激活相关性不一致提供了一个简单而合理的解释:


整合增强子和mRNA表达信息,通过共表达分析可鉴定增强子调控的目的基因。为了鉴定目的基因,研究者引入了eQTL,即影响增强子表达的SNP也同时影响目的基因的表达,进一步对有相互作用的增强子和基因对使用Hi-C数据进行验证。最终通过构建相应的算法,过滤噪音,鉴定出65对相互作用。其对应的基因22个是致癌基因,8个是肿瘤抑制基因,其他30个基因参与肿瘤的增殖和转移过程。这些结果表明增强子激活可能有助于肿瘤进展。


研究者进一步对两个增强子进行研究,一个是enhancer-22,通过计算发现SYK基因与其相关,SYK是致癌基因,与较差的预后相关,进一步通过生存期分析,发现 enhancer-22激活也与较差的预后相关,表明其为指示预后的分子标记。


另外一个增强子为enhancer-9,距PD-L1约140kb距离,在多种癌种中发现enhancer-9和PD-L1共表达;同时也在肺癌的细胞系中证实了这种共表达的存在;Hi-C数据进一步证实了enhancer-9与PD-L1直接相互作用。对ChIP-seq数据分析发现NF-κB和enhancer-9增强子以及PD-L1启动子区结合,最新的研究也表明NF-κB能够激活PD-L1表达。进一步的CRISPR/Cas9 RNAs (sgRNAs) 敲除enhancer-9在RNA及蛋白水平都降低了PD-L1的表达,激活NF-κB也不能促进PD-L1表达。这一结果表明NF-κB介导了增强子与启动子的相互作用,从而调控PD-L1表达。


此研究首次大规模地对30多种癌症进行增强子表达分析,构建鉴定增强子与其调控基因的方法,鉴定出大量与癌症发生、发展相关的增强子,最后详述了增强子如何调控PD-L1的表达。这些思路和结果为进一步研究增强子的临床应用提供了参考。


梁晗简介


梁晗是普瑞基准科技联合创始人、首席科学家,同时还是MD Anderson癌症中心生物信息与计算生物学系副系主任,他还担任国际癌症基因组多种癌症科学组免疫基因组共同主席以及美国癌症基因组多种癌症临床和预测科学组主席。在过去年5年间,梁晗带领团队以TCGA 数据为主题,发表了一系列影响力文章。


声明:以上转载内容并不代表本站观点及立场,且版权归属原创作者。