近来天昊生物为多家合作单位介绍了SNP联合expression数据进行表达数量性状位点分析(eQTL),以及SNP联合methylation数据进行甲基化数量性状位点分析(meQTL),旨在从多组学数据分析和挖掘中寻找新的研究思路,同时可以将以往的SNP/GWAS数据重新利用起来。这样的研究思路可以应用在多种复杂疾病中,包括癌症,从文献检索结果中看,类似思路的文章并不多,然而实现这样的QTL分析文章档次均很高。今天小编就为您介绍两款数据库:泛癌种中SNP如何影响基因表达和甲基化,进行QTL数据分析。
华中科技大学及德克萨斯大学休斯顿健康科学中心的团队合作于2018年1月4日及9月7日在《Nucleic Acids Research》杂志上分别发表了PancanQTL和Pancan-meQTL两款数据库文章1,2。
PancanQTL和Pancan-meQTL两款数据库的数据均来源于The Cancer Genome Atlas (TCGA)数据库,分别介绍了33种癌症的eQTL数据以及23种癌症的meQTL数据,QTL数据又分为cis-QTL和trans-QTL,数据处理过程类似,包括基因型数据、表达数据及甲基化数据收集和处理;协变量分析;eQTL及meQTL识别;survival相关的eQTL/meQTL及GWAS相关的eQTL/meQTL分析等。
(一)
PancanQTL数据库链接为http://bioinfo.life.hust.edu.cn/PancanQTL/,如下图所示主要包含四类数据:Cis-eQTLs, Trans-eQTLs, Survival-eQTLs及GWAS-eQTLs。
在进行eQTL识别分析中包含一系列SNP及表达数据过滤的过程,利用Cis-eQTLs和Trans-eQTLs,结合TCGA中临床数据得到Survival-associated eQTLs,结合GWAS catalog数据得到GWAS-related eQTLs。
从网站链接中我们点击Cis-eQTLs,Cancer type中选择肺腺癌LUAD(N=514),可以输入SNP ID或Gene symbol,比如这里输入KRAS基因,点击search,会显示显著性结果。这些结果提示4个SNP位点会显著影响KRAS基因的表达水平,这样的信息可能对相关的研究有一定的辅助作用,我们可以针对多个目的基因验证其SNP和表达数据,结合前期研究及其它数据找到新的线索。
比如我们点击第一个Box Plot,发现该位点不同基因型下KRAS基因表达存在显著差异,图的信息可以下载PDF格式直接利用。
当然也可以对Cis-eQTLs和Trans-eQTLs数据进行下载,或者按SNP, gene or region进行搜索。
(二)
Pancan-meQTL数据库链接为http://bioinfo.life.hust.edu.cn/Pancan-meQTL/,与PancanQTL类似,数据主要包括Pancan-meQTLs, Cis-meQTLs, Trans-meQTLs, Survival-meQTLs及GWAS-meQTLs。
SNP和甲基化数据分析流程及使用的软件如下。
点击链接中pancan-meQTLs,例如在Gene symbol中输入KRAS基因,同时勾选Cis-meQTL和Trans-meQTL提交能够显示KRAS基因在23个癌种中SNP-methylation的Cis-及Trans-数据,这些结果可以直接下载。
其它的功能类似于PancanQTL数据库,例如点击Cis-meQTLs,Cancer type中选择肺腺癌LUAD(N=448),可以输入SNP ID、Methylation Probe或Gene symbol,比如这里输入EGFR基因,点击search,会显示显著性结果。
结果中我们能够看到多个SNP位点及甲基化探针数据,相关系数以及对应p值,点击第一个Box Plot,发现该SNP位点不同基因型对应的甲基化位点其甲基化水平有显著差异,同样的位点基因的表达水平又如何呢,相应的甲基化位点是否影响该基因的表达?这就需要进一步探索了。
天昊生物在SNP分型及数据分析上拥有无可比拟的优势,多项专利技术能够满足各种通量的SNP分型研究。同时拥有目的区域甲基化测序MethylTarget®专利技术,因此完全满足针对今天介绍的两款数据库中批量数据的验证,满足您在复杂疾病研究中有关eQTL/meQTL分析的科研需求,而类似研究思路的文章在某些疾病中确实罕见!
参考文献
1. Gong J, Mei S, Liu C, et al. PancanQTL: systematic identification of cis-eQTLs and trans-eQTLs in 33 cancer types. Nucleic acids research 2018;46:D971-D6.
2. Gong J, Wan H, Mei S, et al. Pancan-meQTL: a database to systematically evaluate the effects of genetic variants on methylation in human cancer. Nucleic acids research 2018.