背景介绍
罕见遗传性疾病的临床诊断仍然面临诸多问题:
● 外显子组测序的诊断率仅为25%-30%。
● 全基因组测序获得的非编码区序列可占90%,但破坏mRNA正常剪切模式的非编码区突变因难以准确鉴定而常常被忽略。
● 尚没有非常准确的工具可预测单个核苷酸变异而引起的剪切变化
人工智能软件SpliceAI
人工智能软件的飞速进步,或能帮助我们从新一代测序(NGS)数据中发现与罕见遗传病相关的非编码突变。SpliceAI工具由Illumina团队与加州大学旧金山分校和斯坦福大学的合作者共同开发,基于深度学习预测单个核苷酸变异而引起的剪切变化, 从任意mRNA前体序列对剪切位点进行准确预测(位置、异常剪切概率),从而对非编码RNA区域的突变所导致的异常剪切进行预报,相关文章于2019年1月发表在Cell期刊。
文章图片摘要
● SpliceAI软件,基于32个卷积的深度神经网络, 从mRNA前体序列对剪切位点进行准确预测
● 75%的预测异常剪切突变通过RNA-seq数据被证实
● 在神经发育障碍患者中,约10%的致病突变可能为剪切非编码突变,这种突变会导致异常剪切。
● 异常剪切点突变经常导致可变剪切
● 参考文献:Jaganathan K , Kyriazopoulou Panagiotopoulou S , Mcrae J F , et al. Predicting Splicing from Primary Sequence with Deep Learning[J]. Cell, 2019.
软件下载
python包: https://github.com/Illumina/SpliceAI
运行过程
● 用法
spliceai -I input.vcf -O output.vcf -R genome.fa -A grch37 -D 50
-I: vcf 文件
-O: vcf文件,预测结果SpliceAI=ALLELE|SYMBOL|DS_AG|DS_AL|DS_DG|DS_DL|DP_AG|DP_AL|DP_DG|DP_DL
-R: 参考基因组fasta文件(GRCh37/hg19 or GRCh38/hg38)
-A: grch37 or grch38,还可自定义文件,格式同“基因数据库文件grch37.txt or grch38.txt”
-D: 突变位点和剪切位点的最大距离(default: 50)
-M: 0: raw files; 1: masked file (default: 0)
● 基因数据库示例
● 输入文件示例(vcf文件:存储检测的变异位点信息)
input.vcf
● 输出文件示例
output.vcf
● 结果解读--官网
● 结果解读--示例
突变2:179415988 C>CA的输出CA|TTN|0.07|1.00|0.00|0.00|-7|-1|35|-29可以解释如下:
位置179415981(179415988-7) 突变导致当前位点作为剪切受体的概率增加0.07;
位置179415987(179415988-1) 突变导致当前位点作为剪切受体的概率降低1.00;
位置179416023(179415988+35) 突变导致当前位点作为剪切供体的概率增加0.00;
位置179415959(179415988-29 ) 突变导致当前位点作为剪切供体的概率降低0.00。
延伸阅读-非编码区内含子变异导致可变剪切的文章
● 在来自挪威、法国和美国的20个家庭中发现了遗传性乳腺癌卵巢癌综合征1型的致病基因BRCA1新的致病突变c.5407-25T>A,在此之前,该突变一直被判定为临床意义未明。
参考文献:Høberg-Vetti, H., Ognedal, E., Buisson, A. et al. The intronic BRCA1c.5407-25T>A variant causing partly skipping of exon 23—a likely pathogenic variant with reduced penetrance?. Eur J Hum Genet (2020). https://doi.org/10.1038/s41431-020-0612-1
● VHL基因2号外显子上的同义突变或可导致外显子跳跃,从而引发家族性红细胞增多症或或von Hippel-Lindau病。
参考文献:Marion Lenglet,et al.New lessons from an old gene: complex splicing and a novel cryptic exon in VHL gene cause erythrocytosis and VHL disease. Blood 2018 :blood-2018-03-838235; doi: https://doi.org/10.1182/blood-2018-03-838235
天昊WGS服务升级!
目前,天昊全基因组测序个性化分析流程已纳入SpliceAI分析内容,针对新的WGS分析项目或者已完成的WGS分析,可开展基于SpliceAI软件预测可引起RNA剪切变化的非编码区突变。
SpliceAI,助力天昊生物WGS平台给您更好的突变解读,欢迎老师体验!