白癜风如何防止复发 https://m-mip.39.net/nk/mipso_4747364.html

重点内容:

全面注解肿瘤内异质性(ITH)的泛癌种资源

ITH普遍存在于各种癌症中,并显示出特定于癌症类型的模式

分支系统发育是常见的

亚克隆扩增之间突变过程的动态变化

总结

肿瘤内异质性(ITH)是治疗中出现耐药性的机制之一,因此,在临床上这是一项重要挑战。但是,人们对各种癌症类型ITH的程度、起源和驱动因素知之甚少。为了解决这个问题,作者通过研究个癌症样品的全基因组序列,对38种癌症类型的ITH进行了广泛的表征。几乎所有信息量丰富的样本(95.1%)都包含明显的亚克隆扩展证据,且亚克隆之间频繁分支。在大多数癌症类型中,作者观察到亚克隆驱动突变的正向进化,并确定了癌症类型特异性亚克隆模式相关驱动基因突变、融合、结构变异和拷贝数变化以及亚克隆扩增之间突变过程的动态变化。作者的结果强调了ITH及其驱动能力在肿瘤进化中的重要性,并提供了从全基因组测序数据中全面注释亚克隆的泛癌资源。[1]

引言

肿瘤在进化过程中会积累体细胞突变。这些突变中部分突变是赋予宿主细胞适应性优势的驱动因素,并可能导致克隆扩增。晚期克隆扩增、空间分离和不完全的选择性扩增导致遗传上不同的细胞群,表现为肿瘤内异质性(ITH)。所有癌细胞均携带克隆突变,而亚克隆突变仅存在于一个子集中。

ITH是一项重要的临床挑战,因为它提供了可能驱动癌症进展并导致耐药性出现的遗传变异。亚克隆相关的药物耐药和亚克隆关联的驱动基因突变很常见。ITH可能影响临床试验设计及进展和预后预测。例如,在非小细胞肺癌、头颈癌和多形性胶质母细胞瘤中,ITH中拷贝数改变(CNA)的程度与复发风险增加相关。

ITH可以通过大量并行测序数据来表征,因为包含克隆扩增的细胞共享起始细胞的独特突变集。这些突变中的每一个在肿瘤组织中具有相同的肿瘤细胞比率(CCF),可以通过针对局部拷贝数和样品纯度调整对突变的等位基因频率进行估计。随后根据突变的CCF进行聚类,得出样品的“亚克隆结构”:估计不同肿瘤细胞群体(亚克隆)的数量、CCF和指定的突变。

ITH在各种癌症类型中的表征仍然很差,关于亚克隆群体经受的选择性压力存在很大的不确定性。以前的全癌研究依靠外显子组,从而限制了体细胞突变的检测和亚克隆的解析。最近的研究依靠多区域全基因组、外显子组或目标区域捕获测序来探索特定癌症类型中的ITH。单样本分析可能会低估ITH,因为在一个区域中是克隆的突变可能在另一个区域中是亚克隆(“克隆幻觉”)。相反,无论分析了多少个区域,任何被检测为亚克隆的突变都将保留。因此,通过单样本分析建立的ITH具有保守下限的特点。

在这里,作者开发了一个有效的策略来检测拷贝数和簇突变以评估ITH及其来源、驱动因素以及在肿瘤发展中的作用。作者将这些方法应用于38种组织学类型不同的癌症的个样本,这些样本来自全基因组泛癌分析(PCAWG)计划。与外显子组相比,全基因组测序可提供更多数量级的点突变,检测CNA的分辨率更高,并可检测结构变异(SV)。这些增加了作者分析的广度和深度,并揭示了多种癌症类型中普遍存在的ITH。作者观察到亚克隆中进化和正选择的分支模式。作者确定癌症基因中的亚克隆驱动基因突变和突变特征活性的反复变化。通过本文的研究,作者深入分析了肿瘤进化动力学。

结果

种癌症中ITH的表征

作者利用PCAWG数据集来表征各种癌症类型的ITH,包括单核苷酸变异(SNV)、插入或缺失(indels)、SV和CNA以及亚克隆驱动基因、亚克隆选择和突变特征。

首先,为了检测高可信度的变异,作者开发了用于突变检测、拷贝数检测和亚克隆重建的集成方法(图1A;STARMethods)。具体而言,为了使检测克隆和亚克隆突变的敏感性和特异性最大化,采用了一种共识方法,该方法整合了五种SNV检测算法的输出结果。对于插入缺失突变和SV也采用了类似的方法。

因为拷贝数检测的质量对亚克隆重建有很大影响,所以作者系统地整合了六个拷贝数检测软件的结果(图1A;STAR方法)。每种算法的第一次运行都用于识别所有拷贝数断点并构建一致性断点集合。为了提高灵敏度并获得碱基对的分辨率片段,还插入了SV断点(STAR方法)。在所有CNA检测程序的第二次运行中,引入第一次运行构建的一致性断点集合,从而使不同算法能在几乎相同的断点基础上检测CNA。

纯度和倍性评估可能具有挑战性,因为对于某些癌症样品,理论上可能存在多种组合,并且可能难以区分。通过在六个CNA检测软件之间建立标准获得了统一(STAR方法)。一个专业的流程核查并解决了检测软件结果不一致的情况。作者检测得到的纯度值与近期对肿瘤纯度的交叉组学分析结果一致性高。接下来,作者基于肿瘤倍性和杂合性丧失的程度,以客观、自动化的方式定义了经过全基因组复制(WGD)的样品(图1B;STAR方法)。经过WGD的样品证明了同步的染色体增益,进一步验证了作者的方法。最后,根据检测标准,CNA按“等级”分层,以确保对CNA结果的准确反馈。对于95%(中位数)的基因组,使用该研究方法都达成了高度一致(图1C;STAR方法)。

拷贝数、SNV和纯度估计值的一致结果用作11种亚克隆重建方法的输入,并且将这些方法的结果合并为每个肿瘤的单个共识(图1A;STAR方法)。针对亚克隆重建的概率性质,作者使用各个方法的不同输出结果开发了三种共识方法。作者验证了两个独立的模拟数据集上的共识结果,并评估了它们在真实数据上的稳健性。在两个模拟数据集上,共识方法的性能均与最佳个体方法相当,与表现最佳的个体方法也显示出较高的相似性评分(图1D;STAR方法)。在真实数据上,在个体方法和共识方法之间也观察到了最高的相似性,但在个体方法之间却没有观察到最高的相似性(图1D),这证实了采用共识方法可以得到最可靠的亚克隆重建。此外,在先验的最佳方法未知的情况下,所有方法均包含时(STAR方法)可以获得最稳健的性能。因此,作者将一种共识方法的输出(结合所有单独的方法)用作作者通过分析策略(STAR方法)的基础。最终,对于每种肿瘤,作者获得了可检测的亚克隆的数量,亚克隆SNV、插入缺失、SV和CNA的丰度,以及将SNV、插入缺失和SV与亚克隆的对应关系。

为了获得亚克隆中突变数及其CCF的无偏估计,作者考虑了体细胞变异检测软件引起的偏倚。具体来说,随着子克隆的CCF降低,检测其特异性SNV的能力也会降低。这会导致高估亚克隆的CCF,并低估其突变负担。全基因组测序(WGS)检测到的大量SNV有助于量化和纠正这些偏倚。为此,作者开发了两种方法,并在模拟数据上对其进行了验证(STAR方法;图2A),并将它们组合以校正估计的每个亚克隆中SNV和CCF的数量。平均而言,可观察的亚克隆中有14%的SNV低于检测极限(图2B和2C)。CCF低于30%的亚克隆中,平均21%的SNV被漏检。这些值反映了在检测到的亚克隆中缺失的SNV,而不是由于有限的测序深度而仍未被检测到的亚克隆。由于插入缺失和SV检测的建模敏感性随突变reads数的变化而变得复杂,因此方法并未扩展到这些突变类型。作者预计,由于现有算法的敏感性较低,因此会错过较多的SV和Indel。

多种癌症中普遍存在ITH

在作者的共识中,评估多种癌症中亚克隆扩展的证据,作者注意到鉴定亚克隆的能力取决于样品纯度、肿瘤倍性和测序深度。作者将这些结果汇总为一个度量标准,即每个肿瘤染色体拷贝的reads数(nrpcc;代表每个单倍体基因组的测序覆盖率;图S2;STAR方法),并着重于个基因组,其中涵盖了作者的方法可用于检测肿瘤细胞占比大于30%的亚克隆(STAR方法)。以作者的方法分辨率(图3A),在个肿瘤(95.1%)中出现了一个或多个亚克隆扩增。重要的是,这些估计是基于单样本重构和中位数约46×的reads覆盖率,提供了一个保守的下限,因为这种情况下,作者没有能力检测微小的亚克隆。另外,由于通常仅对肿瘤的一部分进行测序,因此可能无法对某些亚克隆进行采样,并且某些突变可能会受到“克隆幻觉”的影响。对PCAWG中五个不同的多区域测序原发性前列腺肿瘤的分析表明,在作者的单样本分析中,平均44%的突变漏检,而26%的亚克隆突变似乎是克隆的,这些结果与已发表的文献一致。

作者的方法发现超过75%的样本显示出在所有癌症类型中至少一种亚克隆扩增的证据(图3A),但皮肤黑素瘤除外,在作者的方法中,62个样本中只有31个可检测到亚克隆。在有10个或10个以上样本的30种癌症类型中,有25种癌症类型中的90%以上样本具有至少一个可检测亚克隆。

在不同癌症类型之间,鉴定出的亚克隆SNV占比(校正缺失的SNV之后)差异很大(图3B)。鳞状细胞癌通常表现出较低的亚克隆SNV占比(头颈部为9.7%±11.9%;肺为6.1%±6.7%;子宫颈为20.6%±19.6%;平均值±标准差),而发色肾细胞癌(45.2%±22.7%),胰腺神经内分泌肿瘤(46%±24.7%)和毛细胞星形细胞瘤(61.3%±14.8%)表现最高。

Indel、SV和CNA也显示了癌症类型之间的类似的巨大差异。对于插入缺失突变,亚克隆占比的范围从肺鳞癌的6.2%±11.7%到胰腺神经内分泌肿瘤的43.4%±23.7%(图3C)。对于SVs,脂肪肉瘤和皮肤黑色素瘤的亚克隆占比最低(分别为8.0%±14.1%和8.9%±15.5%),而发色肾细胞癌则最高(56.8%±31.6%)(图3D)。亚克隆拷贝数占比的变化在发色肾细胞癌中最低(13.3%±16.8%),在前列腺腺癌中最高(53.8%±32.0%)(图3E)。将这些值与SNV负担、受CNA影响的基因组比例、每种癌症类型的WGD频率以及作者的nrpcc检测效力进行比较,结果表明,这些指标均不能解释这种广泛的差异(图3F-3I)。尽管作者观察到具有较高肿瘤突变负荷的癌症类型显示出较低的亚克隆SNV占比(图3B和3F),但是在评估单个肿瘤时(STAR方法)作者没有看到相似的关系。亚克隆中插入缺失突变和SNV的占比高度相关(Pearson’sR2=0.73),而SV遵循相似的趋势(插入缺失突变,R2=0.62,SNVR2=0.51)(图3B-3E和S4)。相比之下,亚克隆中大型CNA和SNV的平均比例仅具有弱相关性(R2=0.24),表明这些可能由独立的突变过程驱动或随时间受到不同的选择压力。

某些癌症类型(例如鳞状细胞癌)在所有突变类型中ITH都是有限的,而其他癌症类型在特定类别中显示了丰富的ITH。例如,胰腺神经内分泌肿瘤在CNA突变类型上几乎没有亚克隆,但在所有其他变异类别中亚克隆负担却很高(图3B-3E)。最后,在每种癌症类型的肿瘤之间,亚克隆突变的占比差异很大(图3B-3E)。

这些发现强调了多种癌症类型中普遍存在ITH。即使在有限的测序深度下,几乎所有肿瘤都显示出亚克隆扩增。此外,亚克隆SNV、插入缺失、SV和CNA的平均比例在不同癌症类型之间差异很大。这些分析描绘了ITH性质的特征性肖像,暗示了每种癌症类型的独特进化历程。

全基因组测序揭示了亚克隆之间的复杂系统发育

两个亚克隆可以彼此线性关联(父子关系),也可以在分支谱系上发展(兄弟亚克隆)。在单样本测序数据上建立亚克隆之间的进化关系具有挑战性,因为分离亚克隆的分辨率有限,并且其CCF估计值存在不确定性。但是,作者可以检查被同一对reads覆盖的SNV对(即可相位SNV对)。具体而言,通过以下方式提供了克隆和亚克隆关系的证据:在没有拷贝数增加的区域中,仅在携带父级SNV的reads子集上发现了归因于子级的SNV(顺式不一致);图4A)。同样,兄弟亚克隆关系的证据由一个模式提供,其中在单倍体区域中,重叠的reads对携带着一个克隆或另一个克隆而不是两者的SNV(反式不一致;图4B)。信息性突变对的数量通常极少,并且取决于突变负荷和拷贝数。但是,PCAWG数据集使我们能够确定可观的信息总数,并探索其系统发育信息内容(STAR方法)。

在正确的背景下具有足够信息且至少有一个可定相的个肿瘤中,有个在顺式SNV对中显示不一致,表明存在克隆和亚克隆关系(图4A)。用它们的共有克隆或亚克隆注释SNV,这些样本中的绝大部分(,95.1%)显示出对证实了预期的克隆-亚克隆关系。另外,有8个样本被分配给不同的子克隆,而16个样本被分配给相同的子克隆,这表明子克隆之间的线性进化。在个带驱动的肿瘤中,有51个在反式SNV对中携带不一致,其中32和27个对分别分配给相同或不同的亚克隆(8个都有),支持同级亚克隆的发生(图4B)。

从可分期SNV对中鉴定亚克隆在很大程度上与共有亚克隆重建无关。因此,可以使用定相结果来评估重建的性能,反之亦然。确实,被鉴定为包含更多亚克隆的肿瘤富含线性和分支对(p=3.9×10-15;图4C)。然而,作者鉴定了16个和32个SNV对分配给同一亚克隆但分别以顺式和反式显示不一致的样本,这证实了作者的共识方法仅鉴定了亚克隆扩增数目的下限。有趣的是,通过共识重建被认为是克隆的8个皮肤黑色素瘤具有1-2个亚克隆的分期证据,这表明绝大多数皮肤黑色素瘤也包含亚克隆扩增。然而,这些肿瘤中的大量克隆突变可能会掩盖这些。

通过将定相分析限制在单倍体区域和两个SNV都已分配给亚克隆的配对中,可以直接评估分支频率与线性进化的频率。在该子集中,可以以相似的潜力检测线性和分支关系。作者发现,在泛癌环境中,与克隆和亚克隆关系相比,两个亚克隆的兄弟姐妹关系可能性高3.11倍(自举95%置信区间[1.71;7.50];图4D)。这与从多区域取样研究(例如TRACERx肺癌队列)获得的系统发育一致,odds是2.86(自举95%置信区间[1.93;5.07];图4E;STAR方法),并且观察到亚克隆驱动子和广泛的并行进化。

该分支与线性的比率似乎与突变率无关。尽管统计效力有限,但作者没有观察到报告线性和分支reads对的可检测样本之间的突变负荷差异(图4F;Wilcoxon秩和检验,p=0.)。同样,TRACERx队列显示突变负荷与线性和分支亚克隆关系的比例之间没有相关性(图4G;Spearman’srho=0.,p=0.)。在PCAWG(21个区域,5个独立肿瘤,每个2–6个区域)多区域测序的原发性前列腺癌中作者还可以检测低突变负荷个体的分支进化。使用Battenberg算法和追踪等位基因对多区域的单倍型定相揭示了在五个肿瘤中的三个中具有镜像亚克隆等位基因失衡的基因座(图4H;STAR方法)。这些等位基因对增加或缺失的模式通常是通过兄弟姐妹亚克隆的平行进化而产生的,这与先前对这些病例的子集所做的研究得出的结论一致。作者的结果表明,即使在那些突变率较低的肿瘤中,分支进化也是各种肿瘤类型中的常态。

多种癌症的亚克隆突变特征动态变化的模式

克隆和亚克隆谱系之间的突变过程可能在动态上有所不同。为了详细探讨它们的动态特性,作者检查了亚克隆突变特征的动态变化。作者认为,如果在亚克隆扩增过程中激活了突变进程,则只有扩增后的突变会带有相应的特征。因此,可以按照SNV的顺序标识及拷贝数和CCF识别特征的动态更改点,以反映伪时间(STAR方法)。这种方法是对作者最近的研究的补充,该研究对众多亚克隆的特征进行平均。在携带丰富SNV的个样本中,有1个或多个特征(通过置换和自举建立的保守阈值;STAR方法)的个(76%)动态变化超过6%。作者检测到平均每个样本有1.77个动态变化的突变特征。

总体而言,根据作者最近的发现,突变特征动态在克隆和亚克隆之间非常稳定。变化最频繁的特征(特征SBS12,病因未知,在个肝癌中有个[61%]有效)在60%的激活样本中是可变的(图5A)。在超过一半的活跃肿瘤(慢性淋巴细胞性白血病(CLL)和B细胞非霍奇金淋巴瘤)中,突变特征SBS9(与激活诱导的脱氨酶[AID]相关的DNA聚合酶Polh)活性伴随CCF的降低而降低。

接下来,作者评估每种癌症类型的特征轨迹(图5A)。在CLL中,SBS9总是减少,而SBS5(假设可以反映低保真DNA修复)几乎总是增加。相比之下,在卵巢癌中,肿瘤的比例相似且低,其变化是向上和向下的。特征动态变化通常范围不大,CLL中记录的变化最大(33%,SBS9)。有些特征在许多癌症类型(例如病因学未知的SBS5和SBS40)均能观察到,但其他特征仅在一种或几种癌症类型中发现。例如,在食管腺癌中,SBS3(双链断裂修复)增加,而SBS17(病因未知)减少。

在相同类型的癌症中,单个样品中(例如,在CLL中,图5B)特征的动态变化与CCF呈现单调函数的关系。换句话说,突变动态变化减少或增加(图5C和S5)是持续的。CLL和肺腺癌特征的动态变化从克隆突变转变为亚克隆突变过程中出现了显著的变化,但在多种亚克隆扩展中表现出稳定的变化(图5C)。相反,食管腺癌显示SBS17活性稳定下降,而甲状腺腺癌通常显示SBS2/13(载脂蛋白BmRNA编辑酶,催化性多肽样或APOBEC)持续增加。

有趣的是,CLL和B细胞非霍奇金淋巴瘤中SBS9活性的变化反映了B细胞向癌症演变的解剖过程。具有SBS9的肿瘤起源于发芽后的中心B细胞。在这些情况下,SBS9引起原始的克隆突变,但不引起亚克隆突变,因为只有肿瘤发生细胞才在生发中心暴露于体细胞超突变。此谱系中的后期细胞已离开生发中心,不再暴露于AID。同样,皮肤黑色素瘤中SBS7(紫外线)活性的降低表明,这些肿瘤已进展为侵袭皮肤内层,而UVB无法达到。最后,同时发生的SBS4(吸烟)减少和SBS2/13(APOBEC)活性增加表明,在肺癌中,在外部诱变剂促进肿瘤早期演化后细胞内在过程接管了肿瘤的进一步演化。

突变特征的动态变化标记亚克隆边界

如果亚克隆的出现与突变过程活性的变化有关,作者期望特征变化点与(亚)克隆之间的CCF边界重合。根据以前的研究,重点

  • 下一篇文章: 没有了