最近又有很多在线数据库进行了发布和更新,及时了解并巧妙运用这些免费的网上资源,会让我们的研究事半功倍。今天小编就跟大家总结一下Nucleic Acids Research 10月以来最新发布和更新的一些数据库信息。
DNA相关:
1、CAGm:千人基因组计划中germline微卫星变异的数据库
CAGm: a repository of germline microsatellite variations in the 1000 genomes project
Published:18 October 2018
人类基因组含有大量微卫星(一类短串联重复),被认为是遗传变异的重要来源,其长度变异会影响基因表达等。但是,微卫星变异往往受到测序深度和样本量限制。本网站提供了千人基因组项目中2529个人germline微卫星的比较分析(CAGm)。CAGm的一个关键创新之处是能够按群体、种族(超级群体)和性别汇总微卫星变异。该数据库提供了对嵌入基因和功能元件中的微卫星的高级搜索。所有数据都可以作为Microsoft Excel电子表格下载,并且是免费的。
2、了解KEGG基因组变异的新方法
New approach for understanding genome variations in KEGG
网址:https://www.kegg.jp/和https://www.genome.jp/kegg/
Published:13 October 2018
KEGG(京都基因和基因组百科全书)是常用的分析生物基因组序列和其他高通量数据的参考知识库。它是一个综合性数据库,由基因组信息、化学信息,以及人类特有的健康信息这三类遗传系统信息组成。KEGG路径图、BRITE层次结构和KEGG模块已经被开发为具有功能性正交节点的通用分子网络图。但是这种通用方法不能很好代表健康信息类别,未考虑人类基因组的变异,特别是与疾病相关的变异。因此,在最近发布的KEGG网络数据库中引入了一种新的方法,人类基因变异被明确地整合到称之为“网络变体”之中。这使得人们能够积累有关疾病相关扰动分子网络的知识,这些扰动分子网络不仅是由基因变异引起的,也可能由病毒和其他病原体、环境因素和药物引起的。这将使KEGG数据库将成为另一个参考知识库,用于疾病机制以及临床测序和药物开发中得到实际应用。
3、CellMarker: 人类和老鼠细胞标记的人工收集资源
CellMarker: a manually curated resource of cell markers in human and mouse
网址:http://biocc.hrbmu.edu.cn/CellMarker/和http://bio-bigdata.hrbmu.edu.cn/CellMarker/
Published:5 October 2018
生物学中最基本的问题之一是什么类型的细胞以功能协调的方式形成不同的组织和器官。更大规模的单细胞测序和生物学实验研究正在开辟解决这一问题的新途径,揭示了用于区分组织中不同细胞类型的大量细胞标记。CellMarker即为细胞标记数据库,旨在为人类和小鼠组织中各种细胞类型提供全面、准确的细胞标记资源。通过手动整理超过10万篇已发表的论文,记录了4124条条目,包括细胞标记信息、组织类型、细胞类型、癌症信息和来源。最后,收集了158个人组织/亚组织中467种细胞类型的13605个细胞标记,以及81个小鼠组织/亚组织中389种细胞类型的9148个细胞标记。CellMarker提供了一个用户友好的界面,用于浏览、搜索和下载不同组织的不同细胞类型的标记。CellMarker是细胞研究的一个全面和有价值的资源,可以精确识别和表征细胞,特别是在单细胞水平。
4、CancerSEA:癌症单细胞状态图谱
CancerSEA: a cancer single-cell state atlas
网址:http://biocc.hrbmu.edu.cn/CancerSEA/或http://202.97.205.69/CancerSEA/
Published:18 October 2018
癌细胞的高度功能异质性是癌症研究的一大挑战。单细胞测序技术提供了一个前所未有的机会,以单细胞分辨率破译癌细胞的不同功能状态,癌症scRNA-seq数据集已经大量积累。这就迫切需要建立一种专用资源来解码癌细胞的功能状态。CancerSEA是第一个专门的数据库,旨在全面探索单细胞水平上癌细胞的不同功能状态。CancerSEA描绘了癌症单细胞功能状态图谱,涉及来自25种癌症类型的41900个癌症单细胞的14种功能状态(包括干细胞、侵袭、转移、增殖、EMT、血管生成、凋亡、细胞周期、分化、DNA损伤、DNA修复、缺氧、炎症和终止)。它允许查询哪些功能状态与不同癌症中感兴趣的基因(或基因列表)相关联。CancerSEA还提供了所有癌症、特定癌症和单个癌症单细胞数据集中与功能状态相关的PCG/lncRNA库。CancerSEA提供了一个用户友好的界面,用于全面搜索、浏览、可视化和下载成千上万个癌细胞的功能状态和相应的PCGs / lncRNAs表达信息。
5、CancerSplicingQTL: 人类全基因组鉴定癌症剪接QTLs数据库
CancerSplicingQTL: a database for genome-wide identification of splicing QTLs in human cancer
网址:http://www.cancersplicingqtl-hust.com/
Published:18 October 2018
在癌症的发生、发展、预后和治疗中经常观察到异常选择性剪接(AS)模式。AS可能会受到基因变异的调节。剪接数量性状基因座(sQTLs)是一种影响该事件的遗传变异,它的鉴定可能是全面理解遗传变异体在疾病发展中的贡献的重要一步。利用来自癌症基因组图谱的基因型数据和TCGASpliceSeq计算的相应AS值,研究者开发了一个计算管道,从33种癌症类型的9026个肿瘤样本中识别sQTLs,鉴定出所有癌症类型的4599598 sQTLs。通过生存分析,确定了17072个与患者总生存时间相关的sQTLs。此外,使用全基因组关联研究( GWAS )目录数据,发现了1180132个sQTLs与已知GWAS连锁不平衡区域重叠。最终根据上述数据构建了一个用户友好的数据库CancerSplicingQTL供用户方便地浏览、搜索和下载感兴趣的数据。这个数据库提供了一个信息丰富的sQTL资源,用于进一步描述控制人类癌症转录异构体的SNPs的潜在功能作用。
RNA相关:
6、LncRNADisease 2.0:长链非编码RNA相关疾病更新数据库
LncRNADisease 2.0: an updated database of long non-coding RNA-associated diseases
网址:http://www.rnanut.net/lncrnadisease/
Published:4 October 2018
越来越多的证据表明,长链非编码RNAs (lncRNAs)功能障碍与多种疾病有关。一个系统收集和治疗lncRNA疾病关联的知识库对于进一步研究潜在分子机制至关重要。2013年, LncRNADisease第一版发布,代表了收集实验支持的lncRNA疾病关联的数据库。这次研究者对该数据库进行了更新。LncRNADisease 2.0新功能包括: (i)与此前版本相比,lncRNA疾病关联提高了40倍以上;(ii)提供lncRNA、mRNA和miRNA之间的转录调节关系;(iii)为每个疾病关联lncRNA提供一个置信度得分;(iv)整合实验支持的circRNA疾病关联。LncRNADisease 2.0记录了20多万个疾病关联lncRNA。这个数据库将继续作为与lncRNAs相关的潜在临床应用的宝贵来源。
7、RPFdb v2.0:核糖体印迹产生翻译mRNA的全基因组信息更新数据库
RPFdb v2.0: an updated database for genome-wide information of translated mRNA generated from ribosome profiling
网址:http://www.rpfdb.org或http://sysbio.sysu.edu.cn/rpfdb
Published:18 October 2018
RPFdb是一个用于托管、分析和可视化核糖体印迹测序(ribo-seq)数据的公共数据库。研究者此次更新的版本RPFdb 2.0带来了显著的数据扩展、特征改进和功能优化:(i) RPFdb 2.0目前托管着来自293项研究的2884个ribo-seq数据集,涵盖29个不同物种;(ii)采用了具有多步质量控制的精细分析管道,以改进核糖序列数据的预处理和比对;(iii)增加了新的功能模块,为每个核糖序列数据提供主动翻译的开放阅读框信息;(iv)提供了更多功能来提高数据库的可用性。随着这些添加和增强,RPFdb 2.0将成为基因调控社区更有价值和更全面的数据库。
8、EVmiRNA:胞外囊泡miRNA谱的数据库
EVmiRNA: a database of miRNA profiling in extracellular vesicles
网址:http://bioinfo.life.hust.edu.cn/EVmiRNA
Published:18 October 2018
胞外囊泡(EVs),如外泌体和微泡,可以作为细胞间的交流载体和疾病潜在生物标志物。miRNAs是EVs中研究最深入的分子,因此对EVs中miRNA表达谱的全面研究将有助于探索它们的功能和生物标志物。研究者从17种来源/疾病中收集了462个EVs miRNA测序样本,构建了EVmiRNA数据库,以展示miRNA表达谱。研究者发现超过1000个miRNAs在这些EVs中表达,并检测到每种来源/疾病的EVs的特异性miRNAs。EVmiRNA提供三个功能模块:(i)来自不同来源(如血液、母乳等)的EVs的miRNA表达谱和样本信息。 (ii)在不同的EVs中特异性表达的miRNAs,这将有助于生物标志物的鉴定;(iii) miRNA注释,包括EVs和TCGA癌症类型中的miRNA表达、miRNA调控途径以及miRNA功能和文献。EVmiRNA具有用户友好的网页界面,具有强大的浏览和搜索功能以及数据下载功能。这是第一个关注EVs中miRNA表达谱的数据库,将有助于EVs生物标志物、miRNA功能和液体活组织检查的研究和应用。
9、LncBook: 人类长链非编码RNAs的精选知识库
LncBook: a curated knowledgebase of human long non-coding RNAs
网址:http://bigd.big.ac.cn/lncbook
Published:17 October 2018
长链非编码RNAs(lncRNAs)在许多生物过程中具有重要的功能。尽管已知人类lncRNAs的数量急剧增加,但却注释不足。研究者提供了一个全面收集和通过多组学数据整合、功能注释和疾病关联的数据库LncBook,它容纳了大量270044个lncRNA,包括1867个具有3762个功能关联的特征lncRNA。它还整合了大量来自表达、甲基化、基因组变异和lncRNA-miRNA相互作用的多组学数据。此外,LncBook整合了3772个实验验证的lncRNA疾病关联,并进一步鉴定了总共97998个lncRNA,这些lncRNA被认为与疾病相关。LncBook致力于人类lncRNAs及其相关数据的集成和管理,将成为全世界研究人员的宝贵知识库。
表观相关:
10、EWASdb: 表观组学范围的关联研究数据库
EWASdb: epigenome-wide association study database
网址:http://www.ewas.org.cn/ewasdb和http://www.bioapp.org/ewasdb
Published:13 October 2018
DNA甲基化是目前研究最深入的表观遗传修饰,在理解疾病的分子机制方面发挥着重要作用。此外,表观组范围的关联研究(EWAS)提供了一种系统的方法来识别常见疾病/表型背后的表观遗传变异。然而,没有一个全面的数据库来存储EWAS的结果。为了填补这个空白,人们开发出了EWASdb数据库,用于存储EWAS DNA甲基化的表观遗传关联结果,目前已经储存1319个与302种疾病/表型相关的EWAS。EWASdb数据库有三种类型的EWAS结果:(i)单一标记的EWAS;(ii)用于KEGG途径的EWAS和(iii)用于GO (基因本体)类别的EWAS。迄今为止,来自43个国家的研究人员已经搜索或下载了第一个全面的EWAS数据库。EWASdb将成为一种宝贵的资源,对疾病/表型的表观遗传学研究做出重大贡献。
11、NucMap:一个跨物种全基因组核小体定位图数据库
NucMap: a database of genome-wide nucleosome positioning map across species
网址:http://bigd.big.ac.cn/nucmap/
Published:18 October 2018
核小体定位动力学影响染色质状态、转录和基因组DNA上发生的所有其他生物过程。虽然MNase-Seq在过去几年中被用于描述真核生物中的核小体定位图,但是核小体定位数据正在急剧增加。为了便于在研究中使用已发表的数据,研究者开发了一个名为核小体定位图的数据库NucMap,它包括来自15个物种的477个样本的798个MNase-Seq实验数据。通过一系列功能模块,用户可以搜索所有样本中每个基因启动子区域核小体定位的概况,并对所有基因组区域的核小体定位数据进行富集分析。构建核小体浏览器来可视化核小体定位的轮廓。用户还可以使用核小体浏览器可视化多种omics数据源,并进行并排比较。数据库中所有处理过的数据都是免费提供的。NucMap是第一个全面的核小体定位平台,它将作为一个重要的资源来促进对染色质调节的理解。