(一)
The genetic basis of inbreeding depression in potato
马铃薯近亲繁殖衰退的遗传基础
近亲繁殖衰退降低了遗传亲属后代的适应性。马铃薯作为无性繁殖作物,近亲繁殖严重衰退;然而,马铃薯近亲繁殖衰退的遗传基础在很大程度上是未知的。为了深入了解马铃薯近交衰退,研究者评估了151个二倍体马铃薯的突变负荷,并获得了344831个预测的有害突变。马铃薯中的有害突变在着丝粒周围区域富集,并且是线特异性的。使用三个F2群体,研究者鉴定了15个基因组区域,由于在配子和合子阶段的选择,这些区域存在严重的分离错误。大多数影响存活和生长活力的有害隐性等位基因位于重组率高的区域。其中一个有害等位基因来自一种罕见的突变,这种突变破坏了胚胎发育所需的基因。该研究为马铃薯自交系基因组设计提供了依据。
(二)
Identification of 28 new susceptibility loci for type 2 diabetes in the Japanese population
日本人群2型糖尿病28个新易感位点的鉴定
为了了解日本血统人群中2型糖尿病的遗传学,研究者对四项全基因组关联研究进行了荟萃分析。日本血统的36614名病例和155150名对照。研究鉴定了88个具有115个独立信号的2型糖尿病相关基因座,其中30个中的28个基因座是新的。在28个错义变体中,三个先前未报道的变体在日本和欧洲血统的人之间具有明显的次要等位基因频率差异,包括胰腺腺泡细胞(GP2)和胰岛素分泌(GLP1R)相关基因的错义变体。从GWAS结果中鉴定的分子途径的跨种族比较强调了一系列途径对2型糖尿病的种族共享和异质性影响。
(三)
Biological and clinical insights from genetics of insomnia symptoms
失眠症状遗传学的生物学和临床见解
失眠是一种常见的疾病,与不利的长期医学和精神病学结果相关。失眠与疾病的潜在病理生理过程和因果关系还不清楚。在这里,研究者在英国生物银行(n = 453379)中确定了57个自我报告失眠症状的位点,并在HUNT研究中证实了它们对自我报告失眠症状的影响(n = 14923病例和47610名对照),在伙伴生物银行中医生诊断的失眠(n = 2217病例和14240名对照),以及在英国生物银行(n = 83726)中由加速度计得出的睡眠效率和睡眠持续时间的测量结果表明泛素介导的蛋白水解相关基因和在多个脑区、骨骼肌和肾上腺表达的基因富集。在频繁失眠症状和不宁腿综合征、衰老和心脏代谢、行为、精神和生殖特征之间发现了共同遗传因素的证据。有证据表明失眠症状与冠心病、抑郁症状和主观幸福感之间可能存在因果联系。
(四)
Genome-wide analysis of insomnia in 1,331,010 individuals identifies new risk loci and functional pathways
对1331010名个体失眠的全基因组分析确定了新的风险位点和功能途径
失眠是第二大最普遍的精神障碍,没有足够的治疗方法。尽管遗传性很强,但对相关基因和神经生物学途径的了解仍然有限。在这里,研究者使用一个大的基因关联样本(n = 1331010)来检测新的基因座,并深入了解失眠投诉中涉及的途径、组织和细胞类型。我们通过定位、表达数量性状基因座和染色质定位鉴定了202个基因座,涉及956个基因。荟萃分析解释了2.6%的方差。结果展示了神经元轴突部分、皮质和皮质下组织以及特定细胞类型(包括纹状体、下丘脑和幽闭神经元)的基因集富集。研究者发现与精神特征和睡眠时间有相当大的遗传相关性,与其他睡眠相关特征有适度的相关性。孟德尔随机试验确定了失眠对抑郁症、糖尿病和心血管疾病的因果效应,以及受教育程度和颅内容积的保护作用。本研究突出了失眠涉及的关键大脑区域和细胞类型,并提供了新的治疗目标。
(五)
Protein-coding variants implicate novel genes related to lipid homeostasis contributing to body-fat distribution
蛋白质编码区变异提示参与身体脂肪分布的脂质稳态相关新基因
身体脂肪分布是心血管健康不良后果的危险因素。我们分析了来源于5个人群多达34399个个体和132, 177名欧洲血统个体的外显子芯片数据,分析了芯片覆盖的228,985个编码区和剪切区变异与身体脂肪分布(腰围与臀部的比例,调整了体重指数)的相关性。我们确定了15个常见(MAF≥5%)和9个低频或罕见(MAF < 5%)编码区新变异。基因集合富集分析确定脂质颗粒、脂联素、异常白色脂肪组织生理、骨骼发育和形态是脂肪分布的重要因素,而交叉性状关联则突出心脏代谢与脂肪分布相关。在功能研究中,特别是在果蝇RNAi敲降实验中,我们观察到两个基因(DNAH10 和PLXND1)的敲降导致体内总甘油三酯水平显著增加。我们的研究提示了脂肪分布相关新基因,提示编码区的低频变异研究的重要性。
(六)
Genetic and phenotypic landscape of the major histocompatibilty complex region in the Japanese population
日本人群主要组织相容性复合区的遗传和表型概况
为了对主要组织相容性复合区域进行精细定位, 我们在1120个日本人群中进行了33种人类白细胞抗原 (HLA) 基因的下一代测序, 提供了经典和非经典 HLA 基因的高分辨率等位基因目录和连锁不平衡结构。结合特定人口的深度全基因组测序数据 (n = 1,276), 我们对16190例日本人的大规模全基因组关联研究数据进行了基于 NGS数据的 HLA区域单核苷酸变异和插入缺失的基因型填补。后续的全基因组表型关联研究评估了106个临床表型, 在52个表型中确定了丰富的、显著的基因型-表型关联。精细定位突出显示了经典 HLA 基因区域的多种关联模式的表型独立风险因素。区域范围的遗传力估计和遗传相关网络分析阐明了多种表型共享的多基因结构模式。
(七)
Origin and evolution of the octoploid strawberry genome
八倍体草莓基因组的起源和进化
栽培草莓是由两种野生八倍体物种杂交产生的,这两种物种都是100多万年前四种二倍体祖先物种合并成一个细胞核的后代。本研究报道了栽培八倍体草莓(Fragaria × ananassa)的接近完全染色体规模的组装,并揭示了形成这种复杂异源多倍体的起源和进化过程。研究者鉴定了每种二倍体祖先物种现存的亲缘关系,并为八倍体草莓的北美起源提供了支持。研究者研究了八倍体草莓中四个亚基因组之间的动态,发现了一个显性亚基因组的存在,与其他亚基因组相比,该亚基因组具有显著更高的基因含量、基因表达丰度和同源染色体之间的有偏交换。途径分析表明,某些代谢组学和抗病性状主要受优势亚基因组控制。这些发现和参考基因组应该成为未来进化研究的有力平台,并使草莓分子育种成为可能。
(八)
Integrated analysis of population genomics, transcriptomics and virulence provides novel insights into Streptococcus pyogenes pathogenesis
群体基因组学、转录组学和毒力的综合分析为化脓性链球菌(Streptococcus pyogenes)的发病机制提供了新的见解
化脓性链球菌每年在全世界造成7亿人感染,然而,尽管经过了一个世纪的努力,还是没有针对这种细菌的疫苗获批。尽管已经发表了一些关于细菌病原体的大规模基因组研究,但是目前对大型细菌种群的基因组、转录组和毒力之间的关系仍知之甚少。我们对2,101个emm28化脓杆菌入侵菌株的基因组进行了测序(按照化脓性链球菌M蛋白基因emm分型,该菌有上百种型别,其中引起侵袭性感染或链球菌中毒性休克综合征者往往集中在emm1、emm 3和emm 28等几个型别),从中选取了492个系统发育多样性菌株进行转录组分析,并选择了50个菌株进行毒力评估。这个综合数据集为了解该模型生物体的毒力机制提供了新的理解。全基因组关联研究,表达定量性状位点分析,机器学习和同源突变菌株识别和确认了一个基因间区域的碱基缺失,显著改变整体转录谱和毒力。这种综合研究策略一般适用于任何微生物,可能会对许多人类病原体产生新的治疗方法。
(九)
Landscape of B cell immunity and related immune evasion in human cancers
B细胞免疫及人类肿瘤相关免疫逃逸
肿瘤浸润 B 细胞是微环境中的重要成分, 但其是否有抗肿瘤作用目前尚不明确。我们提升了前期研究的TRUST算法, 从大量肿瘤RNA测序数据中提取B细胞免疫球蛋白超变区域数据。TRUST 从癌症基因组图集组装了超过3000万个B细胞受体免疫球蛋白重链互补决定区3 序列。在不同的人类癌症中观察到广泛的 B 细胞克隆扩张和免疫球蛋白亚类转换事件。在 B 细胞活性升高的肿瘤中, 发现了与抗体依赖性细胞介导的细胞毒性有关的 MICA 和 MICB 基因的体细胞拷贝数变异。IgG3–1亚类开关与 B 细胞-受体亲和力成熟和抗体依赖性细胞介导的细胞毒性途径中的缺陷相互作用。肿瘤浸润 B 细胞受体再聚合反应的综合泛癌种分析, 确定了新的肿瘤免疫逃避机制。
(十)
A statistical framework for cross-tissue transcriptome-wide association analysis
跨组织转录组关联分析的统计框架
转录组范围的关联分析是研究复杂性状遗传结构的有力方法。这种方法的一个关键组成部分是建立一个模型,通过使用在给定组织中具有匹配基因型和基因表达数据的样本来估算基因型的基因表达水平。然而,在任何单一组织样本量有限的情况下,开发稳健而准确的插补模型是一项挑战。在这里,研究者首先介绍一种多任务学习方法来联合估算44个人体组织中的基因表达。与单组织方法相比,该方法在插补精度上平均提高了39%,并为平均多120%的基因生成了有效的插补模型。研究者描述了一个基于汇总统计的测试框架,该框架将多个单组织关联组合成一个强大的指标来量化整个基因-性状关联,称为极限(分子特征的统一测试),应用于多基因组范围的关联结果,并证明其优于单组织策略。