Genbank庫(kù)里的數(shù)據(jù)按來(lái)源于約55,000個(gè)物種,其中56%是人類的基因組序列(所有序列中的34%是人類的EST序列)。每條Genbank數(shù)據(jù)記錄包含了對(duì)序列的簡(jiǎn)要描述,它的科學(xué)命名,物種分類名稱,參考文獻(xiàn),序列特征表,以及序列本身。序列特征表里包含對(duì)序列生物學(xué)特征注釋如:編碼區(qū)、轉(zhuǎn)錄單元、重復(fù)區(qū)域、突變位點(diǎn)或修飾位點(diǎn)等。所有數(shù)據(jù)記錄被劃分在若干個(gè)文件里,如細(xì)菌類、病毒類、靈長(zhǎng)類、嚙齒類,以及EST數(shù)據(jù)、基因組測(cè)序數(shù)據(jù)、大規(guī)?;蚪M序列數(shù)據(jù)等16類,其中EST數(shù)據(jù)等又被各自分成若干個(gè)文件。
Entrez的網(wǎng)址是:http://www.ncbi.nlm.nih.gov/entrez/
BankIt的網(wǎng)址是:http://www.ncbi.nlm.nih.gov/BankIt
Sequin的相關(guān)網(wǎng)址是:http://www.ncbi.nlm.nih.gov/Sequin/
DDBJ的網(wǎng)址是:http://www.ddbj.nig.ac.jp/
<section style="margin: 10px; padding: 0px; max-width: 100%; color: rgb(51, 51, 51); font-family: -apple-system-font, BlinkMacSystemFont, " helvetica="" neue",="" "pingfang="" sc",="" "hiragino="" sans="" gb",="" "microsoft="" yahei="" ui",="" yahei",="" arial,="" sans-serif;="" min-height:="" 1em;="" font-size:="" 16px;="" letter-spacing:="" 2px;="" line-height:="" 2em;="" box-sizing:="" border-box="" !important;="" overflow-wrap:="" break-word="" !important;"="">
目前GDB中有:人類基因組區(qū)域(包括基因、克隆、amplimers PCR 標(biāo)記、斷點(diǎn)breakpoints、細(xì)胞遺傳標(biāo)記cytogenetic markers、易碎位點(diǎn)fragile sites、EST序列、綜合區(qū)域syndromic regions、contigs和重復(fù)序列);人類基因組圖譜(包括細(xì)胞遺傳圖譜、連接圖譜、放射性雜交圖譜、content contig圖譜和綜合圖譜等);人類基因組內(nèi)的變異(包括突變和多態(tài)性,加上等位基因頻率數(shù)據(jù))。GDB數(shù)據(jù)庫(kù)以對(duì)象模型來(lái)保存數(shù)據(jù),提供基于Web的數(shù)據(jù)對(duì)象檢索服務(wù),用戶可以搜索各種類型的對(duì)象,并以圖形方式觀看基因組圖譜。
GDB的網(wǎng)址是:http://www.gdb.org
GDB的國(guó)內(nèi)鏡像是:http://gdb.pku.edu.cn/gdb/