2009年,耶鲁大学的科学家如此评价RNA测序:这些使用RNA-Seq的研究已改变了我们对真核转录组复杂程度的看法。RNA-Seq能够比其他方法更准确地测量转录本及其他异构体的水平。如今,分子生物学家已将RNA-Seq视为探索RNA的最灵敏方法。
在RNA-Seq出现之前,科学家往往采用芯片来分析转录本。“它存在背景和交叉杂交的问题,并且不能检测重复序列的RNA转录本,”NEB的应用科学家Daniela Munafo解释说。此外,芯片只能测定已知的RNA转录本的相对丰度,无法检测极微小的基因表达水平改变,而这对于了解生物反应至关重要。
相比之下,RNA-Seq具有很多优势。它能以单碱基分辨率测定特定基因的表达水平,了解等位基因特异性表达、选择性剪接、RNA编辑等等。RNA-Seq读取转录组序列的能力也让以前未研究过的新事件或新物种得以鉴定,而无需背景知识。
聚焦单个细胞
细胞分离技术的进步让RNA-Seq开始应用在单个细胞上,而不再是一大块样本 。NEB的开发科学家Keerthana Krishnan认为:“单细胞或细胞亚群的高分辨率测序可揭示样本的复杂性。对疾病进展的模型而言,这有助于确定突变来源的细胞。”
在被问及单细胞RNA-Seq的主要应用时,Bio-Rad的高级产品经理Dan Norton指出:“尽管它的应用领域非常广泛,但免疫学一直是一个巨大的推动力。这主要是因为,相对于实体组织的原代细胞而言,免疫细胞更容易获得和分析。从自身免疫性疾病到免疫肿瘤学,研究人员正在研究免疫系统自身的疾病,以及如何利用免疫系统来对付其他疾病。”
发育生物学是另一个主要的应用领域。Norton指出,它的应用范围包括利用干细胞来重现正常的身体过程、疾病状态和器官,以及了解细胞分化的关键发育阶段。
组织和肿瘤鉴定也一直受到关注。“通过研究样本中的细胞分类,研究人员可以回答一些问题,比如哪些群体存在,它们如何随着特定疾病而改变,以及如何鉴定一般的细胞群体,”Norton说。“组织鉴定是全方位的,从胰岛到肝脏、心脏和肿瘤活检。”
通过研究单细胞中的RNA,“你可以看到组织内的某些细胞存在哪些转录本,有哪些不同的细胞类型,以及它们如何随着时间或条件而变化,”Norton解释道。“究其本质,单细胞测序提供了重要的分辨率。”
在某些情况下,比如癌症,研究人员希望鉴定极其罕见的细胞群体,因为它们在克隆演化中起了重要的作用,但达到这一检测水平却不一定实际。“为了检测极其罕见的细胞群体,人们需要让测序达到一定的深度,这不太经济,”Norton说。
当然,获取单细胞的方法也是一个绊脚石。Norton认为,目前并没有一个解离组织的标准方案,往往要牺牲细胞活力,或因细胞应激而引起转录组的变化。因此,尽管单细胞RNA-Seq带来巨大希望,但一些技术上的改进有望使其更进一步。
降低拼图的难度
如今,科学家都想测序更长片段的DNA,以便更好地观察完整的图像。这就好像100块的拼图和1000块的拼图,难度根本就不是一个级别嘛。RNA-Seq也是如此。人们已经开发出一些方法。
据Pacific Biosciences的农业应用总监Emily Hatas介绍,PacBio已开发出全长转录本测序方法Iso-Seq,采用的是长读长的单分子实时测序(SMRT)技术。短读长的测序方法会打断转录本,开展测序,然后利用生物信息学将数据拼在一起。“这个组装的过程特别容易出错,特别是在确定转录的起始位点和终止位点时,”Hatas说。
利用Iso-Seq方法,一个与PacBio合作的研究小组表明,鸡的转录组在复杂性上与人类不相上下。在过去的尝试中,研究人员表示很难从短读长的RNA-Seq数据中鉴定转录本。有了长的序列,可变转录事件的相对比例说明了鸡和人类转录组的相似之处,同时也解释了之前观察到的基因组差异。
近日,四川农业大学的团队也利用这种方法来解析家兔的转录组。他们的分析证明了“通过PacBio测序得到的转录本,在10个MHC基因中重建高度同源序列的能力明显高于来自短读长组装的转录本数据”。而“短读长通过de novo组装,往往容易得到片段化或是混乱的转录本”。
深入挖掘数据
无论RNA-Seq本身有什么进展,数据分析将仍是关键的一步。它涉及到聚类,从字面上讲是将相似事物的数据分组,如转录本。举个例子,人们可以将同一种癌症的患者转录本数据分组。
一些科学家将RNA-Seq的样本聚类应用到癌症数据上。“我们的评估考察了表达评估、非特异筛选后的基因数量和数据转换的策略,”他们总结道。“结果表明,基于基因定量的癌症样本聚类应优先考虑。”
RNA-Seq的结果取决于样本采集和制备,测序方法和平台,以及分析数据的计算方法。各个方面的选择都在不断增加。分子生物学家深信利用RNA-Seq可以解决更多的难题,因为一切才刚刚开始。
(本文转载生物通)