物种分类数据库

物种分类(Taxonomy)数据库是由上海生命科学数据中心建立及维护的，为数据中心内的其他数据提供物种及分类方面的支持。数据库的物种分类信息主要来源于 NCBI taxonomy数据库，数据库收录的物种信息包括物种的分类文献、出版物、基于web的数据库、序列提交者的建议等。但该数据库不为分类学或者系统发育学提供参考标准。我们定期会对数据库进行更新。

普通核酸数据库

普通核酸（CoreNucleotide）是指除EST、GSS、STS以外的其他核酸序列。普通核酸数据库由上海生物信息技术中心下属的生命科学数据中心（简称数据中心）维护。其数据来源可以分为两部分：用户直接提交，以及数据中心根据需要从其他核酸数据库（如Genbank、EMBL）中下载的数据。

Hotdata数据库

生物学的研究生成了大量的有意义的数据，在学术期刊中公布相关成果时，需要通过不同的途径来公布这些数据，其中文献的补充材料是最普遍的方式（我们将这些文献的附加数据称为HotData，热点数据）。以补充材料方式发布的数据大多只能在一定的时间内访问，所以有必要搜集并整理这类数据，进而为深入的统计分析提供支持。

EST数据库

表达序列标签（Expressed Sequence Tag, EST）是基因表达的短cDNA 序列。EST序列携带着基因的某些信息，是寻找新基因、了解基因在基因组中的定位及其精细结构、mRNA可变剪接等研究的重要依据和基础。EST主要应用于新基因克隆、基因组图谱绘制、基因组序列编码区的确定等方面。

Trace数据库

测序峰图（Trace）是测序仪生成的峰图文件，是序列最原始数据。Trace数据的整理、存储对于生物研究有着重要的意义。

引物数据库

引物（Primer）数据库由上海生物信息技术中心下属的生命科学数据中心（简称数据中心）维护。引物数据库接受研究者、研究组织以及专利申请者提交的引物数据并予以发布，注册用户可以通过FTP批量提交数据。

STS数据库

序列标签位点（Sequence Tagged Sites, STS）是基因组序列标记位点，其主要来源有随机位点序列、表达基因序列、遗产标记序列等。STS提供染色体定位信息，对基因作图、基因定位具有重要意义。

GSS数据库

基因组勘测序列（Genome Survey Sequences，GSS）是基因组DNA克隆的一次性部分测序得到的序列。包括随机的基因组勘测序列、cosmid/BAC/YAC末端序列、通过Exon trapped获得基因组序列、通过Alu PCR获得的序列、以及转座子标记（transposon-tagged）序列等。

SRA数据库

随着测序技术的发展，新的测序仪器（比如454, Illumina, ABI Solid, Helicos）开始投入使用。新的技术，新的仪器产生的数据也和以往不同，其测出的单条序列较短，为此我们将其称为小片段序列集（Short Read Archive ，SRA）。最近NCBI和相关仪器的公司又共同制定了一套标准，我们参考这个标准建立了SRA数据库用于存储这类数据。

蛋白质数据库

蛋白质数据库由上海生物信息技术中心下属的生命科学数据中心（简称数据中心）维护。其数据来源主要是UniProt数据库。UniProt数据库是一个经过整理后的蛋白质序列数据库，它致力于提供一个高水平的注释（例如描述蛋白质的功能、作用域结构、翻译后修饰、突变体等）、最低水平的冗余以及与其它数据库的整合。

GEO数据库

LSBI_GEO的目标是构建一个类似GEO的数据库信息系统，可以收录基因表达相关的高通量数据，包括：基因芯片（检查 RNA水平表达丰度的芯片）、SAGE、MPSS、蛋白质芯片、质谱、chip-chip、arrayCGH。提供相关信息的检索、下载服务。用户将这些数据转换为SOFT格式后，可以直接提交。本软件是生命数据中心开发的一系列数据库之一，与其他数据库共用用户管理、检索引擎、结果展示等系统。

基因数据库

本文档描述数据中心基因数据库的功能与页面设计。该数据库所有的数据主要来源于EntrezGene，数据库表格的设计和数据展示基本参照Entrez ene的标准。此外本数据库是通过解析EntrezGene的XML数据文件来设计的.

生物信息资源