(一)
A genetics-led approach defines the drug target landscape of 30 immune-related traits
以遗传学为导向的方法定义30种免疫相关特征的药物靶点
大多数候选药物最终都未能通过后期临床试验,这主要是由于早期靶点选择的效果不佳。具有遗传学信息支持的药物靶点更有可能具有治疗效果,但基于全基因组尺度数据(如全基因组关联研究)对复杂疾病进行药物靶点发现仍然具有挑战性。在本研究中,我们报告了通过功能基因组和免疫相关注释的整合分析,并联合网络连接知识,可以最大限度地提高用于靶点验证的遗传学信息性,并最终通过这个方法为30个免疫表型确定了基因水平和通路水平的靶点优先级。我们演示了我们开发的遗传学主导药物靶点优先方法(优先索引)如何成功识别并预测高通量细胞筛选中的活性测定 (包括L1000、CRISPR、诱变和患者衍生细胞检测),能够确定未探索目标的优先次序,并可以确定目标级特征关系。优先索引是一个开放获取、可扩展的系统,可以加速免疫介导疾病的早期药物靶向选择。
(二)
Recessive gene disruptions in autism spectrum disorder
自闭症谱系障碍的隐性致病基因
每59个人中就有1个人罹患自闭症谱系障碍(ASD)。全基因组关联研究和大规模测序研究强烈提示常见变异和罕见新发变异参与ASD发病。隐性突变也被提示参与ASD,但其贡献大小仍然不太明确。本研究中,我们在一个大型 ASD 队列中,检测到双等位基因功能破坏性突变和破坏性错义突变的富集,携带患者约占总病例的5%。这些患者中只有10%为女性,提示女性保护现象。我们记录的携带双等位基因突变的已知或新出现的隐性神经发育基因包括CA2、DDHD1、NSUN2、PAH、RARB、ROGDI、SLC1A1、USH2A),以及以前未与ASD相关的其他基因,包括FEV(FEV转录因子,ETS家族成员),它编码了血清素回路的核心调控原件。我们的数据完善了隐性突变对ASD贡献的估计,并为ASD未知的生物途径提供了新的线索。
(三)
A deletion mutation in TaHRC confers Fhb1 resistance to Fusarium head blight in wheat
TaHRC中的缺失突变赋予Fhb1对小麦赤霉病的抗性
主要由禾谷镰孢菌引起的小麦赤霉病(FHB)是一种危害全球小麦生产的破坏性病害。Fhb1是中国种质资源中发现的数量性状基因座,对小麦抗Fhb病的影响最大最稳定。在这里,我们表明一种编码假定富含组氨酸的钙结合蛋白的基因TaHRC,是Fhb1介导的Fhb抗性的关键决定因素。我们证明TaHRC编码一种导致FHB易感性的核蛋白,跨越该基因起始密码子的缺失导致FHB抗性。不同材料中TaHRC-R等位基因的相同序列表明Fhb1具有单一的起源,系统发育和单体型分析表明TaHRC-R等位基因最有可能来自携带Dahongpao单体型。这一发现开辟了一条新的途径,通过生物工程方法操纵TaHRC序列来提高小麦和其他谷类作物的FHB抗性。
(四)
Mutation of a histidine-rich calcium-binding-protein gene in wheat confers resistance to Fusarium head blight
小麦富含组氨酸的钙结合蛋白基因的突变赋予对镰孢菌头疫病的抗性
主要由镰孢属物种引起的头疫病或穗疫病可摧毁几乎所有主要谷物作物(特别是小麦),造成巨大的经济损失,并对人类和牲畜造成健康威胁。然而,在培育高抗性品种方面的成绩仍不令人满意。在此,我们分离了主要效应小麦数量性状基因座—Qfhs.njau-3B,并表明它与先前命名的小麦赤霉病抗性基因相同。Fhb1源于染色体3BS上富含组氨酸的钙结合蛋白基因3’外显子的罕见缺失。用Fhb1序列转化的小麦和拟南芥对禾谷镰孢菌传播都表现出增强的抗性。该基因同源物在植物中的翻译产物保存良好,可能对植物生长发育至关重要。Fhb1不仅可用于抑制粮食作物中的镰孢菌头疫病,还可用于改良其他易受镰孢菌物种伤害的植物。
(五)
Quantitative evidence for early metastatic seeding in colorectal cancer
结直肠癌早期转移播种的定量证据
目前,肿瘤的转移时机和分子决定因素都未知,阻碍了其治疗和预防工作。本研究中,我们通过分析来自23名结直肠癌肝转移或者脑转移患者的118例活检样本的外显子测序数据来描述这一致命过程的进化动态。资料显示,原发性肿瘤与转移之间的基因组差异较低,且在很早期就已经有肿瘤驱动基因参与。在空间肿瘤生长模型和统计推理框架内的分析表明, 癌瘤在临床上还检测不到的时候(通常小于0.01 cm3),就有患者出现早期种植转移(81%,21个可评估患者中有17个)。我们在2,751例结肠直肠癌的独立队列中验证早期驱动因素和转移之间的关联,证明了它们作为转移生物标志物的效用。这一概念和分析框架提供了定量的在体证据,证明了在结肠直肠癌的早期就有系统性传播可能发生,并阐明了患者分层和靶向治疗肿瘤驱动因素的策略。
(六)
The genetic evolution of metastatic uveal melanoma
转移性葡萄膜黑色素瘤的遗传进化
葡萄膜黑色素瘤是一种临床上独特且特别致命的黑色素瘤亚型,起源于眼睛中的黑色素细胞。在这里,我们对35名患者的原发性葡萄膜黑色素瘤及其匹配转移进行了多区域基因测序。我们观察到以前未知的驱动突变,并建立了这些和已知驱动突变进行选择的顺序。转移瘤有不同于原发肿瘤的基因组变化;转移性播散有时发生在原发性肿瘤发展的早期。我们的研究为黑色素瘤亚型的遗传学和进化提供了新的见解,为进展和治疗提供了潜在的生物标志物。
(七)
Genome sequencing analysis identifies Epstein–Barr virus subtypes associated with high risk of nasopharyngeal carcinoma
基因组测序分析确定了与鼻咽癌高风险相关的爱泼斯坦-巴尔病毒亚型
爱泼斯坦-巴尔病毒(EBV)感染在世界范围内无处不在,并与多种癌症相关,包括鼻咽癌(NPC)。EBV病毒基因组变异在NPC发展中的重要性及其在中国南方的显著流行尚未得到充分探讨。通过270株EBV分离株的大规模基因组测序和中国EBV分离株的两阶段关联研究,我们在BALF2中鉴定出两个与鼻咽癌风险密切相关的非同义EBV变异体。这些变异的累积效应占中国南方NPC总体风险的83%。风险变异的系统发育分析揭示了亚洲的独特起源,随后是NPC流行区的克隆扩增。我们的研究结果为中国南方的NPC地方病提供了新的见解,也有助于识别NPC病的高危人群。
(八)
Rational targeting of a NuRD subcomplex guided by comprehensive in situ mutagenesis
综合原位诱变指导下NuRD亚复合物的合理靶向
胎儿球蛋白的发育沉默既是时空基因调控的范例,也是β-血红蛋白病治疗干预的机会。核小体重塑和去乙酰化酶(NuRD)染色质复合物参与γ-珠蛋白抑制。我们使用集合CRISPR筛选来全面破坏成人红细胞前体中的NuRD蛋白编码序列。胎儿血红蛋白(HbF)控制所必需的是NuRD蛋白家族旁系的非冗余亚复合物,我们通过亲和层析和邻近标记质谱蛋白质组学证实了其组成。绘制顶部功能指南RNAs确定了关键蛋白质界面,其中框架内等位基因由于亚基的不稳定或功能改变而导致功能丧失。我们确定了CHD4的突变,其对细胞适应性的要求与原代人红细胞前体和转基因小鼠的HbF抑制无关。最后,我们证明了从NuRD现象中隔离CHD4复制了这些突变。这些结果表明了一种发现适合合理生化靶向的蛋白质复合物特征的通用方法。
(九)
High-throughput identification of human SNPs affecting regulatory element activity
高通量技术检测影响人类调控原件活性的SNP
人类基因组有数百万个SNPs,大多数都是非编码区的,并且可能位于假定的调控元件区域。全基因组关联研究(GWAS)将许多SNPs与人类特征或基因表达水平联系起来,但很少具有足够的分辨率来识别真正的功能SNPs。 以前,基于报告基因工具检测SNP对调控原件的活力影响,其筛选通量显然是不够的。本研究中,我们利用SuRE报告检测技术的通量和分辨率来探究 590 万个 SNPs (包括 57% 已知的常见 SNPs)对增强子和启动子活力的影响。我们确定了超过 30,000 个 SNPs可以改变调控原件的活性,且部分呈现细胞特异性。此数据集与 GWAS 结果的集成可能有助于确定作为人类特征的 SNPs 遗传调控模式基础。
(十)
Inferring protein 3D structure from deep mutation scans
从深度突变扫描推断蛋白质三维结构
我们描述了一种三维(3D)结构确定的实验方法,该方法利用了高通量突变扫描日益增加的便利性。受成功使用自然进化序列共变异计算蛋白质和核糖核酸折叠的启发,我们探索了“实验室”合成序列变异是否也可能产生三维结构。我们分析了五次大规模突变扫描,发现实验中阳性上位性最大的残基对足以确定三维折叠。我们表明,三种蛋白质、核酶和蛋白质相互作用的基因筛选中最强的上位性配对揭示了大分子内部和之间的三维接触。使用这些实验上位对,我们计算GB1结构域(在晶体结构的1.8 å内)和WW结构域(2.1 å)。我们提出了减少接触预测所需突变体数量的策略,表明基于基因组学的技术可以有效预测三维结构。
(十一)
Determining protein structures using deep mutagenesis
利用深度诱变确定蛋白质结构
确定大分子的三维结构是生物学研究的主要目标,因为结构和功能之间有着密切的关系;然而,成千上万的蛋白质结构域仍然具有未知的结构。结构测定通常依赖于物理技术,包括x光结晶学、核磁共振波谱和低温电子显微镜。在这里,我们提出了一种方法,该方法允许仅通过测量分子突变变体的活性来确定生物大分子的高分辨率三维骨架结构。这种结构确定的遗传方法依赖于突变之间遗传相互作用(上位性)的量化和直接与间接相互作用的区分。这为结构确定提供了另一种实验策略,有可能揭示功能性和体内结构。