从一个神秘分子到260,000个

2018年,研究乳腺癌的科学家发现了他们无法解释的东西。一种他们命名为T3p的小RNA分子存在于肿瘤组织中,但在健康细胞中完全不存在。它与任何已知基因都不匹配。它不对应于任何公认的非编码RNA类别。用分子生物学的语言来说,它是孤儿——一个在现有人类基因组分类中没有归属的分子。这项单一的令人困惑的发现启动了一项为期六年的调查,现在取得了范围广泛的发现:在32种不同的人类癌症类型中隐藏着约260,000个以前未知的特异于癌症的小RNA。

这项由Jeffrey Wang、Hani Goodarzi及其同事在Arc Institute进行的研究,代表了有史以来对特异于癌症的非编码RNA进行的最全面的调查之一。通过挖掘The Cancer Genome Atlas的数据——一个包含数千个肿瘤基因组信息的里程碑式数据库——该团队识别了一个广阔且以前看不见的小RNA分子景观,这些分子仅出现在癌细胞中。

数字分子条码

使这些孤儿非编码RNA(或oncRNA)特别引人注目的是它们的特异性。所检查的32种癌症类型中的每一种都显示了自己独特的oncRNA表达模式,创建了研究人员所称的数字分子条码。这些条码在多个层次上捕捉癌症身份——不仅区分不同的肿瘤类型(如乳腺癌对肺癌),还区分单一癌症内的亚型,甚至区分单一肿瘤内的不同细胞状态。

为了测试这些分子特征是否可用于实际诊断,该团队建立了基于oncRNA表达模式训练的机器学习分类模型。结果令人印象深刻:这些模型在从肿瘤组织样本中分类癌症类型时达到了90.9%的准确度。当针对一个单独的938个肿瘤组群进行验证时,这些模型以前从未见过这些肿瘤,准确度保持在82.1%——这样的性能水平表明了真正的临床潜力。

从RNA特征单独分类癌症类型的能力可能对原发癌症不明的癌症患者具有深远的影响,这种临床情景影响约3-5%的所有癌症患者,并且由于治疗决策在很大程度上取决于了解癌症起源于何处,因此预后特别差。

一些oncRNA驱动癌症进展

260,000个特异于癌症的RNA的发现提出了一个明显的问题:这些分子仅仅是癌细胞内混乱遗传活动的副产品,还是其中一些分子积极促进肿瘤生长和扩散?为了找出答案,研究人员在小鼠中进行了大规模功能实验,测试了约400个单个oncRNA的生物学效应。

约5%的测试分子表现出可测量的生物学活性。一些引发了上皮间充质转变,这是一种使癌细胞能够从其组织起源处断裂并迁移到身体远处的细胞过程——这被称为转移的致命过程。其他的激活了驱动无限制细胞分裂的增殖通路。这些发现表明,至少一部分oncRNA不是无辜的旁观者,而是癌症进展的积极参与者。

了解哪些oncRNA驱动癌症行为可能会为治疗干预开辟全新的途径。如果特定的oncRNA促进转移或药物耐受性,用基于RNA的疗法靶向它们——这种方法已经用反义寡核苷酸和小干扰RNA显示出临床前景——可能为抵抗现有治疗的癌症提供新的武器。

癌症隐信号的血液检查

也许最直接可转化的发现是,大约30%的oncRNA由癌细胞积极分泌到血流中。这意味着它们可能通过简单的血液抽取——液体活检——而不是需要侵入性的组织取样来检测。

研究人员使用来自192名参加I-SPY 2新辅助化疗试验的乳腺癌患者的血液样本测试了这个概念,这是一项测试手术前新药物组合的大型临床研究。结果令人瞩目:完成化疗后血液中保留高水平残留oncRNA的患者与oncRNA水平下降的患者相比,总体生存期恶化了接近四倍。

这项发现将oncRNA分析定位为监测最小残留病变的潜在工具——可以存活治疗并最终导致复发的少量癌细胞。检测残留病变的现有方法主要依靠影像和循环肿瘤DNA,两者都有重大局限。读取残留癌细胞分子条码的血液检查可能会提供更早、更具体的复发警告,使医生能够在疾病全面返回之前进行干预。

重写癌症基因组学地图

存在260,000个以前未表征的特异于癌症的RNA引发了关于科学家如何彻底映射癌症分子景观的基本问题。人类基因组包含大约20,000个蛋白质编码基因,数十年的癌症研究主要集中在这些基因的突变上——驱动恶性肿瘤的原癌基因和肿瘤抑制基因。oncRNA发现表明,一整层平行的癌症生物学一直在以下阈值处运作,隐藏在一度被驳为垃圾DNA的基因组非编码区域中。

非编码基因组占总人类DNA的约98%,研究人员越来越认识到它在健康和疾病中发挥关键调节作用。但这项研究中识别的特异于癌症的非编码RNA的纯粹数量——超过四分之一百万个不同的分子——超过了大多数科学家会预测的,并暗示该领域仅仅触及了癌症如何利用非编码基因组的理解表面。

接下来的步骤

Arc Institute团队继续表征个别oncRNA,以确定哪些是癌症进展中的驱动因素对旅客。他们还在开发可能将基于oncRNA的癌症监测纳入常规实践的临床级液体活检检测。如果该方法在更大的临床试验中被证明是稳健的,它可能从根本上改变肿瘤学家追踪治疗反应和检测复发的方式——从等待可见肿瘤重新出现的反应式医学转向主动式模型,在血液中读取残留疾病的分子低声。

对于更广泛的癌症研究领域,信息是明确的:地图不是领土,癌症生物学的领土远比之前想象的要复杂。八年前在乳腺癌样本中发现的一个神秘分子导致了整个隐藏的疾病维度的发现——而这些含义才刚开始被理解。

本文基于Science Daily的报道。阅读原始文章