摘要: SSR软件应用分析
SSR (Simple Sequence Repeats,简单序列重复)是一种常用的遗传分子标记。关于SSR特点和检测方法,我们之前写过不少的文章(具体请见文末链接),那么当我们获得了样本间SSR的基因分型信息后又该如何分析呢,今天小编就给大家介绍一下SSR分析中最常用的生信软件“三件套”。
1、PowerMarker软件
PowerMarker相关文章最早发表在2005年的Bioinformatic上。用PowerMarker软件可以进行基因型遗传多样性分析,获得等位基因频率、等位基因数、基因多样性指数及基因型多态性信息含量(PIC),其中的PIC可以用来衡量基因变异程度的高低,一般认为,当PIC<0.25 时,为低度多态性信息引物,0.25<PIC<0.50 时,为中度多态性信息引物,PIC>0.50 时为高度多态性信息引物。通常群体的遗传多样性较高时SSR 标记多态性较好。
网址:http://statgen.ncsu.edu/powermarker/
软件界面举例
2、Structure软件
网址:http://web.stanford.edu/group/pritchardlab/structure.html
利用Structure软件可以进行群体结构估计。通常参数设置为K值选取1~10,重复次数为5;将MCMC(markov chain monte carlo)开始时的不作数迭代设为50000次,再将不作数迭代后的MCMC设为50000次,其余参数采用软件默认的设置。根据lnP(D)计算ΔK,依据ΔK值选择一个合适的K值,并得到该K值对应的Q矩阵(第i材料的基因组变异来源于第k群体的概率)。
3、Tassel软件
网址:https://tassel.bitbucket.io/
Tassel软件相关文章最早发表在2007年的Bioinformatic上,利用Tassel软件可以将基因型数据生成亲缘关系矩阵(K矩阵),结合等位变异数据、基因型数据、各个环境的表型值、Q矩阵, 利用MLM (mixedlinear model)进行性状和标记之间的关联分析,并计算标记位点在P<0.05 和P<0.01 时对表型变异的贡献率(R2)。在已获得关联位点的基础上, 再进行优异等位变异的发掘,通过对SSR 位点等位变异表型效应计算,最终获得与表型性状显著关联的位点等位变异、表型效应及典型品种。
案例分析:
下面分享一篇2017年刚刚发表的文章“Genetic diversity, population structure and association analysis in coconut (Cocos nucifera L.) germplasm using SSR markers”,本研究利用48个SSR分子标记探讨了79种椰子的遗传多样性,种群结构以及与果实产量相关性状的关联分析。
表1、本研究所用的椰子材料情况
表2、连续三年对椰子果实性状表型评价数据
以上是对研究的椰子群体的表型信息进行了统计分析,下面的部分就是结合所测SSR基因分型数据,利用生信工具“三件套”进行的遗传多样性、种群结构以及与性状关联分析,具体如下:
表3、利用PowerMarker软件对椰子基基因型多态性信息含量等指标的统计
图1、群体遗传关系的聚类分析结果
图2、利用Structure软件对椰子群体进行遗传结构分析
表4、利用Tassel软件进行的椰子果实产量关联SSR标记分析
可见,只要大家手上有好的实验材料,在记录统计好表型数据并且准确获得SSR基因分型信息后,就可以利用PowerMarker、Structure和Tassel这“三件套”工具,进行遗传多样性、群体遗传结构和性状关联的探讨了, 只要学好这三种软件,或许SSR的分析并没有想象中的那么难!
往期精选文章:
关于天昊:
天昊生物拥有多种SSR检测平台!值得一提的是,我们自主研发的基于二代高通量测序平台的SSRseq技术,更是具有高准确性和高通量的特点,是SSR检测的“终极”解决方案,我们期待成为您SSR基因分型的优质服务提供商!