短串联重复序列(short tandem tepeats, STR)的扩增常常导致多种遗传疾病的发生。近年来随着下一代测序(next generation sequencing, NGS)的发展,以illumina为代表的短读序数据(short-read data)急剧增长,如何通过对NGS数据的挖掘高效的寻找STR的扩增,发现更多遗传疾病的遗传病因,便成了人们关心的热点之一。
表1、部分由STR扩增导致的遗传疾病列表
去年在F1000Research上刊登的一篇综述性文章,就对4种STR扩增分析方法(ExpansionHunter、exSTRa、STRetch和TREDPARSE)进行了比较。
表2、四种生信工具的比较
而2018年底的AJHG文章通过评估后表明,exSTRa相比其他三种方法表现出更强的的性能,可以有效地用作从WES和WGS数据中筛选STR扩增的工具。
随后,在2019年7月,同样发表在AJHG的文章,基于生物信息学方法从导致CANVAS疾病的RFC1中成功的鉴定出无参考序列的五碱基STR重复扩增突变。
发表期刊:Am J Hum Genet. 发表时间:2019-7-3 影响因子:9.924
图1、CANVAS基因座与4号染色体的连锁及RFC1中exp内含子插入的鉴定
图2、(AAAGG)exp的重复引物PCR验证
(重复引物PCR的代表性图像展示了一种锯齿产物,其具有5个碱基对的重复单位大小,从来自CANVAS1(B)和CANVAS9(C)个体的gNDA扩增获得,(D)为未得病对照样本,(E)为无模板阴性结果。)
本研究综合运用5中生信分析工具:exSTRa、EH、TREDPARSE、STRetch和GangSTR,从9个CANVAS病人WGS数据中,筛选出RFC1 中的(AAAGG)exp基序可能与CANVAS疾病相关联。最后研究人员利用重复引物PCR以及一代测序等方法,验证了(AAAGG)exp这个STR扩增的存在。
关于天昊
天昊生物长期从事基因及遗传分析,可以提供包括全基因组测序、外显子组测序、STR毛细管检测及基于二代测序技术的SSRseqTM等多项验证服务,欢迎联系我们具体咨询!邮箱:techsupport@zjywrdx.com 电话:400-065-6886