生物信息资源

时间:2019-04-18浏览:3497

物种分类数据库

物种分类(Taxonomy)数据库是由上海生命科学数据中心建立及维护的,为数据中心内的其他数据提供物种及分类方面的支持。数据库的物种分类信息主要来源于 NCBI taxonomy数据库,数据库收录的物种信息包括物种的分类文献、出版物、基于web的数据库、序列提交者的建议等。但该数据库不为分类学或者系统发育学提供参考标准。我们定期会对数据库进行更新。

普通核酸数据库

普通核酸(CoreNucleotide)是指除EST、GSS、STS以外的其他核酸序列。普通核酸数据库由上海生物信息技术中心下属的生命科学数据中心(简称数据中心)维护。其数据来源可以分为两部分:用户直接提交,以及数据中心根据需要从其他核酸数据库(如Genbank、EMBL)中下载的数据。

Hotdata数据库

生物学的研究生成了大量的有意义的数据,在学术期刊中公布相关成果时,需要通过不同的途径来公布这些数据,其中文献的补充材料是最普遍的方式(我们将这些文献的附加数据称为HotData,热点数据)。以补充材料方式发布的数据大多只能在一定的时间内访问,所以有必要搜集并整理这类数据,进而为深入的统计分析提供支持。

EST数据库

表达序列标签(Expressed Sequence Tag, EST)是基因表达的短cDNA 序列。EST序列携带着基因的某些信息,是寻找新基因、了解基因在基因组中的定位及其精细结构、mRNA可变剪接等研究的重要依据和基础。EST主要应用于新基因克隆、基因组图谱绘制、基因组序列编码区的确定等方面。

Trace数据库

测序峰图(Trace)是测序仪生成的峰图文件,是序列最原始数据。Trace数据的整理、存储对于生物研究有着重要的意义。

引物数据库

引物(Primer)数据库由上海生物信息技术中心下属的生命科学数据中心(简称数据中心)维护。引物数据库接受研究者、研究组织以及专利申请者提交的引物数据并予以发布,注册用户可以通过FTP批量提交数据。

STS数据库

序列标签位点(Sequence Tagged Sites, STS)是基因组序列标记位点,其主要来源有随机位点序列、表达基因序列、遗产标记序列等。STS提供染色体定位信息,对基因作图、基因定位具有重要意义。

GSS数据库

基因组勘测序列(Genome Survey Sequences,GSS)是基因组DNA克隆的一次性部分测序得到的序列。包括随机的基因组勘测序列、cosmid/BAC/YAC末端序列、通过Exon trapped获得基因组序列、通过Alu PCR获得的序列、以及转座子标记(transposon-tagged)序列等。

SRA数据库

随着测序技术的发展,新的测序仪器(比如454, Illumina, ABI Solid, Helicos)开始投入使用。新的技术,新的仪器产生的数据也和以往不同,其测出的单条序列较短, 为此我们将其称为小片段序列集(Short Read Archive ,SRA)。 最近NCBI和相关仪器的公司又共同制定了一套标准,我们参考这个标准建立了SRA数据库用于存储这类数据。

蛋白质数据库

蛋白质数据库由上海生物信息技术中心下属的生命科学数据中心(简称数据中心)维护。其数据来源主要是UniProt数据库。UniProt数据库是一个经过整理后的蛋白质序列数据库,它致力于提供一个高水平的注释(例如描述蛋白质的功能、作用域结构、翻译后修饰、突变体等)、最低水平的冗余以及与其它数据库的整合。

GEO数据库

LSBI_GEO的目标是构建一个类似GEO的数据库信息系统,可以收录基因表达相关的高通量数据,包括:基因芯片(检查 RNA水平表达丰度的芯片)、SAGE、MPSS、蛋白质芯片、质谱、chip-chip、arrayCGH。提供相关信息的检索、下载服务。用户将这些数据转换为SOFT格式后,可以直接提交。本软件是生命数据中心开发的一系列数据库之一,与其他数据库共用用户管理、检索引擎、结果展示等系统。

基因数据库

本文档描述数据中心基因数据库的功能与页面设计。该数据库所有的数据主要来源于EntrezGene,数据库表格的设计和数据展示基本参照Entrez ene的标准。此外本数据库是通过解析EntrezGene的XML数据文件来设计的.