0%

NGS分析常用数据库简介

NGS分析常用数据库简介

近些年,随着DNA测序技术的快速发展,基因组测序数据也以指数形式高速增长。由于测序的高通量性以及数据的复杂性,一些小实验室自身不具备处理和管理数据的能力。为了进一步管理和维护数据,一些大型科研机构建立了生物信息数据库,得益于计算机和网络的大发展,许多数据库公布在网上,供全世界科研界共享。

根据存储数据的类型可将数据库分为核酸序列数据库,蛋白序列数据库。较早的核酸序列数据库有美国国家生物技术中心(NCBI)的Genbank、欧洲生物信息研究所(EBI)的EMBL以及日本的DDBJ,三个数据库每天同步。

NCBIEBI是常用的数据库,包括千人基因组数据也分别挂在里面。常用到的NGS数据库有NCBI的SRA(Sequence Read Archive)和EBI的ENA(European Nucleotide Archive)。

此外dbSNP为SNP和小型变异的数据库;DGVa和dbVar、DGV为基因组结构变异的数据库。

除了NCBI,基因组研究常用到的还有UCSC和Ensembl,UCSC提供了好多工具,诸如基因组浏览器等,推荐丁香园的一篇帖子,里面有一些使用说明资料可供查阅。