(一)
Allele-specific expression changes dynamically during T cell activation in HLA and other autoimmune loci
等位基因特异性表达在人类白细胞抗原和其他自身免疫位点的T细胞激活过程中动态变化
遗传学研究发现,自身免疫易感变异在记忆性CD4+ T细胞调控元件中显著富集。了解遗传变异如何影响不同T细胞生理状态下的基因表达对破译自身免疫遗传机制至关重要。本研究中,我们对健康个体记忆CD4+ T细胞激活过程中的8个时间点的样本进行高深度RNA-seq,以进行遗传调控效应的动态表征。我们在整个基因组中发现了广泛的、动态的等位基因特异性表达,其中等位基因的平衡情况随时间变化。这些基因在自身免疫基因位点内富集了4倍。我们在6个HLA基因中发现了普遍的动态调节效应。HLA-DQB1等位基因具有三种不同的转录调控程序之一。利用CRISPR-Cas9基因组编辑技术,我们证明了一个启动子变异对HLA-DQB1表达的T细胞特异性调控具有因果关系。我们的研究表明,顺式调控元件的基因变异以一种依赖于淋巴细胞激活状态的方式影响基因的表达,最终表现为免疫反应的个体间复杂性。
(二)
Systematic identification of silencers in human cells
人类细胞中沉默子的系统鉴定
人类基因组中的大部分基因组序列不编码蛋白质。这些非编码区包含了许多控制基因表达的重要调控序列。到目前为止,大多数研究都集中在增强子区域,但抑制基因表达的区域--沉默子--还没有被系统地研究过。我们开发了一个系统,在沉默子介导的caspase 转录抑制基础上,在全基因组范围内识别沉默子区域。我们发现,沉默子分布广泛,并可能以组织特异性的方式发挥作用。这些沉默子具有独特的表观遗传特征,并与特定的转录因子相关。沉默子还在多个基因上,以及在染色体结构域和长程相互作用水平上起作用。删除与药物转运基因ABCC2和ABCG2相关的沉默子区域导致化疗抗性。总之,我们的研究表明,组织特异性沉默在整个人类基因组中广泛存在,可能对基因表达和人类生物学的调控有很大的贡献。
(三)
Chromatin interaction analyses elucidate the roles of PRC2-bound silencers in mouse development
染色质相互作用分析阐明了结合PRC2的沉默子在小鼠发育中的作用
在动物发育过程中,转录激活和抑制之间的平衡调节着基因表达。关于以增强子为中心的转录激活已经有了很多认知,但对沉默子及其在正常发育中的作用仍不甚了解。在本研究中,我们对转录基因沉默的关键诱导剂Polycomb repressive complex 2 (PRC2)进行了染色质相互作用分析,以揭示沉默子及其分子特征和相关染色质连接性。对顺式调控型沉默子原件的系统分析揭示了其染色质特征和基因靶向特异性。在小鼠中删除某些PRC2-bound silencers导致其相互作用基因的转录减低,并导致包括胚胎致死性在内的多形性发育表型。虽然一些PRC2结合的元素在多能细胞中作为沉默子发挥作用,但它们在发育过程中可以过渡到活性组织特异性增强剂,突出了它们的调控多功能性。我们的研究描述了沉默子的分子特征及其相关的染色质结构,并提出了表观遗传性沉默基因靶向重激活的可能性。
(四)
Lysine 4 of histone H3.3 is required for embryonic stem cell differentiation, histone enrichment at regulatory regions and transcription accuracy
组蛋白H3.3的赖氨酸4是胚胎干细胞分化、调节区组蛋白富集和转录准确性所必需的
在赖氨酸4(H3K4)或赖氨酸36(H3K36)处修饰组蛋白H3的酶的突变与人类疾病有关,然而这些残基在哺乳动物中的作用尚不清楚。我们将K4或K36突变为组蛋白变体H3.3中的丙氨酸,并表明K4A突变在小鼠胚胎干细胞(ESCs)中会损害分化,并诱导广泛的基因表达变化。K4A导致H3.3的大量消耗,尤其是在ESC启动子处;同时伴随着重塑原件结合的减少和RNA聚合酶II(Pol II)活性的增加。H3.3K4A耗尽的调控区显示出组蛋白修饰的改变和增强子活性的变化,并与基因表达相关。相比之下,K36A突变没有改变H3.3沉积,并在分化后期影响基因表达。因此,H3K4是核糖体沉积、组蛋白周转和染色质重塑原件在调控区的结合所需要的,而Pol II活性的严密调控是ESC正常分化所必需的。
(五)
Interplay between whole-genome doubling and the accumulation of deleterious alterations in cancer evolution
全基因组加倍和癌症进化中有害变化积累之间的相互作用
全基因组加倍(WGD)是癌症中的一个普遍事件,涉及到整个染色体得加倍。然而,尽管已知其普遍性和预后相关性,但WGD在癌症中的演化选择压力还没有得到研究。在这里,我们结合进化模拟与癌症测序数据分析,探讨WGD在癌症演化过程中的进化模拟。模拟结果表明,WGD可以被选择来减轻不可逆的、棘轮状的、有害的体细胞变异积累,只要它们以足够高的速率发生。与此相一致,我们观察到WGD在具有广泛的异质性损失的肿瘤类型中富集,包括肺鳞癌和三阴性乳腺癌,我们发现在WGD之前,存在对必需基因的同源性损失的负选择证据,而不是WGD发生之后。最后,我们证明了杂合缺失和突变的时空剖析可以用来鉴定新的肿瘤抑制基因,并获得已知癌症基因的更深层次的表征。
(六)
Disruption of chromatin folding domains by somatic genomic rearrangements in human cancer
人类癌症中染色质折叠结构域被体细胞基因组重排破坏
染色质被折叠成连续的层,以容纳线性DNA。同一拓扑连接域(TADs)内的基因表现出相似的表达和组蛋白修饰特征,而分隔不同域的边界在加强这些特征的稳定性方面具有重要作用。事实上,在人类癌症中,域中断会导致基因表达的误调。然而,域中断在人类癌症中的频率仍不清楚。本研究作为国际癌症基因组联盟(ICGC)的泛癌症全基因组分析(PCAWG)联盟和癌症基因组图谱(TCGA)的一部分,本联盟聚合了来自38种肿瘤类型的2658种癌症的全基因组测序数据,我们分析了288,457个体细胞结构变异(SV),以了解SV在TAD中的分布和影响。值得注意的是,SVs可以导致离散的TADs融合,复杂的重排可以显著改变肿瘤基因组中的染色质折叠图谱。值得注意的是,14%的边界删除即可导致附近基因的表达变化超过2倍以上。
(七)
Pan-cancer analysis of whole genomes identifies driver rearrangements promoted by LINE-1 retrotransposition
全基因组的泛癌分析确定了由LINE-1反向转座促进的驱动基因重排
大约一半的癌症都有转录子的体外整合。为了表征它们在肿瘤发生中的作用,我们在泛癌症全基因组分析(PCAWG)项目的框架内,分析了来自38个组织学癌症亚型的2954个癌症基因组中的反转录转座事件的模式和机制。我们确定了19,166个体外获得性的转座事件,影响了35%的样本,并跨越了一系列事件类型。长散在重复序列(LINE-1;以下简称L1)插入作为食管腺癌中最常见的体细胞结构变异类型,在头颈部癌和结直肠癌中居第二位。异常的L1整合可以删除一条染色体上的兆单位碱基区域,有时会导致肿瘤抑制基因的删除,并可诱发复杂的转位和大规模复制。体外反转录转座也可以启动断裂-融合桥循环,导致肿瘤基因的高度扩增。这些观察结果阐明了L1反转录转座在重塑癌症基因组中的相关作用,对人类肿瘤的发展具有潜在的影响。
(八)
The landscape of viral associations in human cancers
人类癌症中病毒关联的景观图
作为泛癌症全基因组分析(PCAWG)联盟的一部分,我们对38种肿瘤类型的2,658个癌症的全基因组和部分全转录组测序数据进行了汇总,我们系统地调查了潜在的病毒病原体,使用一种集成了三个独立的分析流程的共识方法。我们在382个基因组和68个转录组数据集中检测到了病毒。其中已知的肿瘤相关病毒如爱泼斯坦-巴尔病毒(EBV)、乙肝病毒(HBV)和人乳头瘤病毒(HPV;例如,HPV16或HPV18)的发现率很高。该研究发现,HPV和驱动型突变在头颈部癌中具有显著的排异性,并且HPV与APOBEC突变标志物相关,这表明抗病毒防御受损是宫颈癌、膀胱癌和头颈癌的驱动力。对于HBV、HPV16、HPV18和腺相关病毒-2(AAV2),病毒整合与基因组拷贝数的局部变异有关。TERT启动子的整合与高端粒酶的表达相关,显然激活了这一肿瘤驱动过程。高水平的内源性逆转录病毒(ERV1)表达与肾癌患者的生存结局更差有关。
(九)
Comprehensive molecular characterization of mitochondrial genomes in human cancers
人类癌症线粒体基因组的综合分子特征
线粒体是重要的细胞器,在癌症中起着关键作用。作为国际癌症基因组联合体/癌症基因组图集泛癌症全基因组分析联合体的一部分,我们对来自38种肿瘤类型的2658种癌症的全基因组测序数据进行了多维度的综合表征,并对线粒体基因组和相关的RNA测序数据进行了多维度的综合表征。我们的分析展示了线粒体基因组最明确的突变图谱,并确定了几种高度基因突变的情况。截断突变在肾癌、结直肠癌和甲状腺癌中明显富集,提示致癌作用与信号通路的激活有关。我们发现线粒体核转移高频率发生,其中一些破坏了治疗性靶基因。线粒体拷贝数在癌症内部和不同癌症之间差异很大,并与临床变量相关。共表达分析强调了线粒体基因在氧化磷酸化、DNA修复和细胞周期中的功能,并显示了它们与临床可作用基因的联系。我们的研究为将线粒体生物学转化为临床应用奠定基础。