基因融合
基因融合在基因组中非常普遍,也是一些类型癌症的标志。它是由两个不相关的基因融合形成的一种基因产物,具有全新的功能或与两个融合前基因不同的功能。一个强启动子与一个下游功能基因(原癌基因)的融合在某些癌症中是普遍的。创建融合基因的机制与生成基因的功能一样多变。据估计半数的前列腺癌含有TMPRSS2和ETS转录因子家族成员之间的融合。目前有几种测序的方法用于研究融合基因,如肿瘤的全基因组测序和mRNA-Seq。
全基因组测序研究的成功要点:
利用Illumina的测序技术很容易检测基因融合,其中末端配对(PE)测序的应用对成功检测融合基因尤为关键。全基因组测序及末端配对序列是目前检测所有基因融合的最准确、最全面的工具,这些基因融合包括了重复、倒位、覆盖和单碱基插入缺失。
全基因组测序在发现全新的基因融合断裂点方面更胜一筹,测序的深度和更长的测序序列实现了在融合连接单元单碱基的分辨率,为研究产生融合的机制提供了线索。这一能力是测序所独有的。
mRNA-Seq是一种非常高效的方法,能为大量样品的筛查提供一种相对经济高效的途径。mRNA-Seq研究一般基于高表达融合基因将有着最大生物学影响的假设,它对检测高表达癌基因特别有效,但仅限于有着polyA尾巴的基因,很难获得基因间隔区域和UTR区域上的信息。
大多数RNA-Seq分析比对的算法假设RNA序列中的所有相关序列片段均来自同一个染色体,而基因融合的两个基因往往来自两个不同染色体,例如断裂-融合-桥接循环所产生的基因融合对于这类情况,传统算法往往无法检测或正确拼接。
许多研究使用培养的细胞系,肿瘤细胞系更是癌症研究的常规工具,但这些细胞系能在多大程度上代表原发肿瘤仍不清楚。天生不稳定的细胞系经过长时间培养后可积累大量突变,而培养过程中种群减少所造成的遗传瓶颈又会大大加速突变的累积。
目前大部分发表的研究所包含的样品数量是非常少的,所以大部分测序研究被认为是假设推导生成的。在测序实验的设计中,许多未解决的问题仍然存在,例如我们还不清楚在测序实验中如何应用多重检验纠正。随着更多的测序信息出现,大部分癌症类型可根据其分子表型划分为几种亚型,这使得实验本身的作用严重降低,而可靠分析所需的样品数量却大大增加。我们预计未来为获得统计学上可靠的的结果,测序实验的样本量会非常大,达到成千上万。
基因组突变
所有癌症在发展过程中都会积累大量体细胞突变,其中司机突变是对癌症发展很关键的体细胞改变,而剩下的就被称为乘客突变。目前研究人员已经编制出一些癌症类型的体细胞突变综合目录。
这篇文章展示了一些原发性人类前列腺癌及其配对正常组织的完整基因组序列。一些肿瘤包含复杂的平衡重排链(拷贝数中性),它们发生在已知癌基因中或附近。一些断裂点发生在基因间区域,可能会被靶定外显子测序的方法错过。在88%的病例中,融合点可定位到单碱基分辨率。最常见的融合类型涉及到一个精确连接,其重排连接处既无重叠也无插入序列。这一结果与乳腺肿瘤中所发现的模式不同,后者最常见的连接涉及到一个2-3 bp的微同源序列,这表明前列腺癌和乳腺癌负责产生这些融合的机制是不同的。这篇文章例证了有些突变只有通过全基因组测序才能检测出来。