英国维康基金会桑格研究所的研究人员测序了560位乳腺癌患者的肿瘤和正常组织的全基因组,鉴定出93个驱动基因,以及与缺陷DNA修复和BRCA1及BRCA2功能相关的突变标签(mutational signatures),揭示了乳腺癌的基因起源和驱动机制。相关研究于5月2日发表在《Nature》和《Nature Communications》上,是目前最全面的乳腺癌基因组分析。
发表在《Nature》的文章中,由桑格研究所主任Michael Stratton和癌症基因组计划负责人Serena Nik-Zainal领导的研究小组测序了556位女性和4位男性乳腺癌患者的肿瘤和正常组织基因组,另外还对部分患者进行了转录组测序、microRNA表达分析、基于阵列的拷贝数分析和甲基化数据分析。Stratton说,“这项迄今为止最大的单一类型癌症研究告诉我们,乳腺癌中存在哪些基因变异以及它们在基因组中的发生位置。寻找癌症间的基因变异对开发改进的疗法至关重要。”
通过测序,研究人员发现了3,479,652个体细胞碱基替换,371,993个小型插入/缺失和77,695个重组,结合之前发表的另外772个乳腺癌基因组测序数据,发现了5个之前未知的驱动基因。研究人员共在93个基因中鉴定出1,628个可能的驱动突变。95%的基因组至少有一个驱动基因。10个最常见的突变基因是TP53, PIK3CA, MYC, CCND1, PTEN, ERBB2, the ZNF703/FGFR1 locus, GATA3, RB1和MAP3K1,占驱动基因的62%。
尽管研究人员鉴定出若干可能激活驱动基因的in-frame融合基因,他们发现复发性基因融合(recurrent gene fusions)很少表达。相反,一些基因CDKN2A, RB1, MAP3K1, PTEN, MAP2K4, ARID1B, FBXW7, MLLT4 和TP53的重组较为常见。
研究人员还分析了基因组的非编码区。他们在PLEKHS1, TBC1D12和WDR74的启动子中,以及长非编码RNA MALAT1和NEAT1中发现了复发性突变(recurrent mutations)。
不同的突变过程产生不同类型的突变标签。例如,有特定的突变标签与紫外线辐射和吸烟引起的DNA损失相关。以前的研究已经基于碱基替换模式鉴定出了5个乳腺癌突变标签。在这项研究中,研究人员利用数学模型来寻找癌症基因组中的其他标签,共发现了12个(包括前面所述的5个)。在另7个新发现的突变标签中,5个在其他类型的癌症中发现过,2个是第一次被发现。
接下来,研究人员又鉴定出了6个重组标签。标签1~3的特征是串联重复。标签3存在于91%的具有BRCA1突变的癌症中,在基底细胞样乳腺癌、三阴性乳腺癌和具有很高同源重组缺陷评分的乳腺癌中常见。重组标签5的特征是出现小于100 kb的缺失。标签2的特征是出现大于100kb缺失,在雌激素受体阳性乳腺癌中常见。560例病例中90例有BRCA1或BRCA2突变,其中60例为胚系突变,14例为体细胞突变。由于BRCA1和BRCA2缺陷的基因组仅与标签3或5相关,研究人员表示,鉴定这些突变标签是未来做诊断的基础。
发表于《Nature Communications》的文章中,研究人员进一步地研究了突变标签,鉴定与它们相关的突变过程。他们发现,一些标签是年龄相关的,以胞嘧啶脱氨为主;一些标签与APOBEC、错配修复缺陷或同源重组缺陷相关;一些标签的病因不明。欧洲分子生物学实验室欧洲生物信息学研究所所长Ewan Birney领导了这一分析,他说,“基因改变和它们在癌症基因组中的位置影响患者对治疗的响应。这一研究带给我们一种新的方式来描述乳腺癌的突变类型。”
参考文献:
1. Landscape of somatic mutations in 560 breast cancer whole-genomesequences. Nature (2016) doi:10.1038/nature17676
2. The topography of mutational processesin breast cancer genomes. Nature Communications 7, doi:10.1038/ncomms11383