參考基因組該怎么下載?

2016-01-08    編輯:諾禾致源

參考基因組具備最完整的信息(基因區、非編碼區、調控區),
是進行基因組學、轉錄組學和表觀組學研究的先決條件。
大量已公布的參考基因組數據,成為科研工作者的巨大寶庫。
以下對各數據庫查找參考基因組的方法作簡單介紹,供學習和參考。

Ensembl

由 European Bioinformatics Institute(EBI)與 Wellcome Trust Sanger Institute(WTSI)共同合作開發的 Ensembl 數據庫覆蓋物種廣,信息更新快;隨著技術發展和研究的深入,有的物種基因組會有多個版本,Ensembl 數據庫以最及時的更新受到廣大研究者的青睞。

查看方法演示>>

NCBI

NCBI(National Center for Biotechnology Information)即美國國立生物技術信息中心,其在線平臺信息全面且功能強大,1992年10月承擔了建立并維護 GenBank DNA 序列數據庫的責任。

查看方法演示>>

UCSC

由 University of California Santa Cruz (UCSC) 創立和維護的 UCSC 數據庫,但是覆蓋物種信息有限,而且信息更新相對滯后(如基因組版本更新),所以 UCSC 數據庫使用率稍遜色于前兩個數據庫。

查看方法演示>>

Private Database

在以上數據庫查找不到的參考基因組,還可以嘗試一些
Private Database,如:

植物參考基因組數據庫 Phytozome
查看數據庫>>

小鼠基因組數據庫 MGD
查看數據庫>>

擬南芥基因組數據庫 ZFIN
查看數據庫>>

......

注意事項

1.

數據庫的選擇還要根據具體物種信息來判斷,各個數據庫各有優勢。如:有的基因組版本較新,序列信息更完整,但有的注釋信息可能不完全。所以,數據庫的選擇,以及基因組版本的選擇,需要綜合考慮。

2.

真核生物,基因組由多條染色體構成。NCBI 數據庫中每個染色體的基因序列對應一個文件,而 Ensembl 的 toplevel.fa.gz 文件匯總了所有染色體基因 信息于一個文件。Ensembl 數據庫提供的文件更方便使用。

3.

沒有參考基因組,可以對該物種進行全基因組 de novo 測序,并進行拼接組裝,從而得到該物種全基因組序列圖譜。

安卓手机捕鱼游戏 新时时二星组选 摩卡登线上娱乐官网 足球让球胜负平 百人牛牛d 360导航老时时 快乐十分任选二倍率 mg电子游戏什么爆率高 赛车冠军走势图怎么看 排列三试机号 湖南快乐十分电视图