前段时间为大家介绍了2018年发表在NAR杂志上的m6AVar数据库 (链接:【昊工具】m6AVar数据库:又一个热点,前沿的宝藏数据库),我们提到这个数据库收集了可能影响m6A修饰的基因组SNP信息,因此是研究m6A相关变异和疾病间的关系的一种有用资源。今天小编就来带大家阅读一篇生信挖掘文章,一起来看看作者是如何利用公开的GWAS数据和在线数据库,阐述“m6A SNP---影响基因的m6A修饰---影响基因的表达---GWAS表现阳性信号”这一可能的遗传学机制并轻松发表IF4+的文章的吧!文章题目:In silico genome-wide identification of m6A-associated SNPs as potential functional variants for periodontitis.影响因子:4.522 PMID:31245852期刊年卷:J. Cell. Physiol. 2019 Jun 27
研究背景
※牙周炎(PD)是一种常见的炎症性疾病,目前已报道的PD相关位点多位于非蛋白编码区,很难解释其功能。
※影响RNA m6A修饰的一组SNP,可能是一类重要的功能基因组位点。
研究方法
※下载PD
一个公开GWAS的统计数据(非基因型原始数据,而是是统计值数据,表型为牙龈沟液的interleukin (IL)‐1β表达水平)
※下载m6AVar数据库的m6A相关SNP列表(http://m6avar.renlab.org):包括13,703 个高度可信SNP位点 (miCLIP/PA‐m6A‐seq experiments), 54,222 个中度可信位点(MeRIP‐Seq experiments)和245,076个低可信度位点 (random genome prediction based on random forest algorithms)
※Haploreg数据库查询:HaploReg 数据库 (http://archive.broadinstitute.org/mammals/
haploreg/haploreg.php) 除了可以注释SNP,同时还收集了很多SNP的调控信息,其中包括来源于13个人类表达数量调控性状位点研究的数据(包括多种组织和细胞系),这样便可以查阅SNP是否有证据在某种组织或细胞中调控某个基因表达的调控作用。
※RegulomeDB数据库查询:RegulomeDB (http://regulome.stanford.edu/) 和HaploReg数据库类似,为基因组SNP提供了大量的调控证据数据,可以查询SNP 是否影响蛋白结合,改变motif或者影响DNase,从而阐述SNP可能的调控作用。※NCBI GEO数据库:NCBI GEO(http://www.ncbi.nlm.nih.gov/geo)收录了很多公开的表达谱和测序数据,作者下载了牙龈组织基因表达相关的四个数据集。
研究结果
图:研究流程图和主要结果
※PD GWAS的阳性关联SNP与m6Avar数据库下载的m6A-SNP取交集,共获得104个PD相关m6A-SNP
※在Haploreg数据库查询这些SNP是否为所在基因eQTL,结果发现65个位点显示eQTL信号,同时,研究者注释了最阳性的20个SNP的其它调控证据(下表)。
※针对这65个SNP,作者下载了GEO的牙龈表达数据,探究了这些SNP所在基因是不是在患者和对照中存在差异表达。最终,作者发现48个基因至少在一个数据中表达出差异表达,提示这些m6A SNP可能通过影响m6A修饰,进而影响基因的表达,最终参与了PD疾病的发生,从而在PD GWAS研究中表现出阳性信号。一个典型的PD相关位点rs2723183,与PD相关(P=3.93E-07),同时调节IL37基因的的表达,并且IL37基因在3个数据集中的患者和对照牙龈组织存在差异表达。
研究结论
m6A-SNP可能通过调控基因的表达而参与PD疾病的发生发展。
通过这篇生信挖掘文章,至少有四个宝藏数据库值得大家了解,说不定就可以让你的研究事半功倍哦。
m6AVar数据库:http://m6avar.renlab.org
Haploreg数据库:http://archive.broadinstitute.org/mammals/haploreg/haploreg.php
RegulomeDB 数据库:http://www.regulomedb.org/
NCBI GEO数据库:http://www.ncbi.nlm.nih.gov/geo