全基因組Survey

產品介紹常見問題結果展示


結果展示

基因組大小預估

K-mer深度分布服從泊松分布,根據曲線獲得K-mer深度期望值,用于估計基因組大小。
一般來說我們會選擇K-mer分布最多的峰為主峰,主峰所對應的深度值為K-mer深度期望值。
基因組大小=K-mer總數/K-mer期望深度值。

K-mer K-mer number K-mer Depth Genome Size(Mbp) Revised Genome Size (Mbp)
17 47,719,794,696 62 769.67 763.41

雜合度和重復率評估

在理想的數據模型中,即不存在重復序列或者雜合的情況,
一套基因組上的每個K-mer應該只出現唯一一次,也就是說,對于基因組上的所有的K-mer來說,它的頻率數均為1;
而在實際樣品的基因組中,會存在雜合和重復序列的情況,因此每個K-mer對應的頻數不確定。
K-mer可以根據其出現的頻率數來分類,基于貝葉斯模型和K-mer所有的頻率數和深度屬性,
可以得到并且通過迭代來修正,由此反映基因組的雜合率和重復序列的情況。

GC含量分布圖

橫坐標表示GC含量,縱坐標表示測序深度,右方是contig覆蓋深度分布,上方是GC含量分布,我們選取長度在2Kb以上的contig序列,根據其GC分布以及覆蓋深度信息繪制散點圖,其中紅色的部分代表該散點圖中點的密度比較大的部分,可以看到在紅色區域部分,該物種的GC分布呈現出兩部分的區域分布,兩部分的重心分別在深度20左右和40左右,即對應右邊的contig覆蓋分布,在20位置的小峰為雜合峰,在40位置的為純合峰。對應紅色的散點圖,深度在20左右的紅色區域是雜合contig的GC分布區域;再看上方的GC含量分布,主峰在35的位置,和我們計算得到的基因組的GC含量基本一致,且紅色的散點也分布在GC含量在35%附近,說明該基因組沒有受到其他外源物種的污染。

SSR標記開發

簡單重復序列(以下簡稱SSR)是分子生物學中一種重要的分子標記,可以運用于遺傳圖譜構建,功能基因定位及QTL定位等許多方面。檢測DNA序列中簡單重復序列使用SR search軟件。

同源注釋

基于初步組裝的結果,采用同源預測的方法對被測物種進行基因預測。將已知的同源物種的編碼蛋白序列與被測物種的基因組序列進行比對。用基因結構預測得到的蛋白質序列與已知蛋白數據庫比對,如:Swissprot、KEGG以及Trembl等。

安卓手机捕鱼游戏 二十一点怎么玩 英国时时彩开奖记录 手机游戏推荐 ag平台出租 北京赛pk10计划追号 香港购物app 五大联赛什么意思 上海时时最快结果 好心水高手论坛开奖结果 体彩第19100期什么时候开奖