文章题目:Genetic Variation and Association Mapping of Seed-Related Traits in Cultivated Peanut (Arachis hypogaea L.) Using Single-Locus Simple Sequence Repeat Markers
利用单位点简单重复序列标记(SSR)进行栽培种花生遗传变异与种子相关性状关联分析
发表期刊:Frontiers in Plant Science 发表时间:2017-12-11 影响因子:4.3
摘要一览:
花生是世界重要的食用油和可消化蛋白质来源,其栽培种(Arachis hypogaea L.)是一种异源四倍体(AABB,2n = 4x = 40),它的种子大小和重量是显著影响花生产量与营养成分的重要农艺性状。然而目前对种子相关性状的遗传基础认识仍然模糊不清。关联作图是快速有效地探索植物重要性状遗传基础的有力途径。在这项研究中,研究人员利用554个单位点SSR分子标记,对104个花生品种的种子相关性状进行了关联研究。大部分花生品种在检测组合中与SSR标记没有或弱相关,连锁不平衡的衰减在基因组水平大约为1cM的遗传距离,并且B亚组的LD衰减比A亚组要快。在关联分析中四个与种子相关性状观察到了很大的表型变异。针对人口结构和亲缘关系采用混合线性模型,检测到不同环境中与4个种子性状显著相关的30个SSR标记(P<1.81x10-3),解释了各种性状表型变异的11.22-32.30%,其中AHGA44686标记可以解释多种环境下的大量表型变异(26.23-32.30%)。与种子性状相关有利等位基因的关联分子标记,以及相关标记等位基因最佳组合的确定,显著提高了性状表现,揭示了这些关联标记在花生育种中的应用潜力。
实验材料:
中国花生99份核心种质和附加的五份品种(Zhonghua 6_vul、Zhonghua 10_vul、Yuanza 9102_vul、ICG6375_vul和ICG12625_aeq)。
研究方法:
1、SSR分子标记多态性及基因分型检测
新鲜叶片提取DNA,1%琼脂糖凝胶进行质检。汇总公开发表文献中的4485个SSR标记,对表型变异丰富的十个品种进行标记多态性检测。随后,对单位点模式分离的多态性标记进行毛细管电泳筛选,利用GeneMarker软件进行数据转换后用于104个品种的基因型关联检测。杂合子基因型作为缺失数据处理,罕见等位基因型SSR的次要等位基因频率(MAF)不大于0.05,对于部分无法归类的将舍弃处理以此增加关联分析的效能。分子标记PIC和基因多样性利用PowerMarker软件计算获得。
2、群体结构与亲缘关系分析
群体结构(Q矩阵)的评估是利用STRUCTURE软件,基于SSR分子标记多态性进行的。STRUCTURE是一种基于模型的聚类方法,利用多位点基因型数据推断种群结构并将个体分配给群体。应用独立等位基因频率的混合模型从1到10估计每一个可能的群(K)。为了得到可靠的亚群,其他参数设置为一个更高的标准,例如老化长度测试以100000次迭代,每个K跑五次。为了获得最佳K值,一种通过K值间的LnP(D)变化速率来计算(ΔK)的方法被广泛应用。如果计算品种的同类可能性 ≥ 0.70则被划为一组,否则将归类到混合组中。Nei’s遗传距离是根据PowerMarker软件的无根邻接树计算获得。亲缘关系系数估计矩阵利用SPAGeDi软件包进行计算。
3、连锁不平衡分析
一般来说,相关系数r2是用来评估LD的,常使用的软件如TASSEL。r2显著性分析是通过Fisher检验计算的,这些SSR标记通过定位到花生的高密度遗传连锁图谱上来评估其LD水平。位于同一连锁群标记对被视为连锁的标记,否则为不连锁标记。LD背景定义为95%不连锁标记的r2分布,这被视为判断LD是否为遗传连锁的群体特定阈值。遗传距离的LD衰减是通过区间间隔而非对应各个标记来估计,基于标记间距离将r2值分为0–0.5、0.5–1、1–2、2–5、5–10、10–15、15–20、20–25、25–50、50–75、75–100和100–150 cM的距离,然后利用非线性回归函数对LD衰减进行拟合。LD衰减不仅对整个基因组,而且在A和B亚组水平进行。
4、全基因组关联分析
利用TASSEL软件的简化混合线性模型(cMLM)来进行关联分析,通过同时根据群体结构(Q矩阵)和相对亲缘关系(K矩阵)来限制分散关联。在这项研究中,人们使用调整后的Bonferroni法对关联分析进行多重检验校正,其中P值阈值为1.81 x 10-3。
研究结果
1、花生种群结构和亲缘关系检测
在4485个SSR标记中,共有554个SSR标记呈现单点模型的多态性分离。利用这554个多态性SSR标记对种群结构进行评估。最显著的LnP(D)变化出现在K从2到3时,峰值出现在K为3时(图1)。根据分组概率分析,所有品种可划分到三个类群或混合群中的任何一个。Pop1组共有40种(37.70%),其中27种(67.50%)属于ssp. hypogaea。29种被分到Pop2组,其中96.60%属于ssp. fastigiata。第三组POP 3包括12种,混合组中有8个(34.80%个)和15个(65.20%个)分别加入到ssp. hypogaea和ssp. fastigiata中。聚类划分基于Nei’s遗传距离(图2)。
图1、花生检测的群体结构。
(A)两种方法确定最佳的K值。(B)在K=3情况下计算的群体结构
图2、基于SSR基因分型数据的树状图
群体相对亲缘关系是通过对554个单点SSR标记检测进行评价的。平均相对亲缘关系值为0.11。超过70%的成对亲缘估计值低于0.05,在较高的亲缘关系评估类别中,亲缘值下降频率不断降低,表明这些种质之间没有或有非常弱的遗传关系(图3)。
图3、相对亲缘关系估计分布图
2、花生基因组LD衰减分析
花生关联LD程度通过定位到20个连锁群的274个SSR位点r2评估,所有检测中,平均r2是0.01,大部分(67.10%)r2值显示出统计学的显著。并且,在每个群中发现了高连锁水平标记(表1)。
表1、所有检测亚群的连锁不平衡结果
为了给LD 衰减得到一个特定群体的r2阈值,研究者收集了不连锁标记背景的LD水平,即 r2=0. 27。发现全基因组LD衰减到1 cM时的背景就是r2=0. 27(图4A),并且B亚组LD衰减的比A亚组要快。(图4B)。
图4、104个品种的LD衰减图(A)全基因组LD衰减 (B)A、B两亚组的LD衰减
3、花生遗传多样性分析
在单点模型中具有多态性和共分离的SSR标记有554个。最终,在2~12的群体中获得了1950个等位基因,平均每个位点有3.50个等位基因。平均多态信息含量为0.47。虽然Pop1组包含最多的种质,但每个位点的等位基因(2.70)、基因多样性(0.25)和PIC(0.22)最低。在四个亚群中,混合群的主等位基因频率(0.58)最低,而具有最高的单位点等位基因水平(3.40)及基因多样性(0.53)和PIC(0.47)水平(表2)。
表2、结构分析分组的多样性相关统计结果
4、种子相关性状的表型变异分析
分析发现不同环境下种子长度、宽度、长宽比及百粒重的情况(图5,表3-4)
图5、五种环境下种子相关性状表型变化分布图
表3、花生四种种子相关性状表型变化表
5、种子性状全基因组关联定位
总共发现与表型变异的性状显著关联标记(MTAs)共30个,能够解释11.22到32.30%的表型(表5)。在五个环境中检测到9个与SL显著相关的标记,从11.64到31.45%不等。只有2个标记与种子宽度SW关联,但有10个标记与长宽比关联。9个标记与百粒重关联。
表4、种子相关性状相关性分析
表5、种子相关性状与标记关联情况
6、有益等位变异积累分析
从前面的分析中,发现了多个与种子表型关联的SSR标记,发现AGGS1312和AHGA44686之间有24个单倍性,其中7个可以用于对性状的评估。
结论: