有兩個問題想請教版友
雖然說已經把人類genome解開了,不過我看ncbi的資料庫中還是有很多gap
http://0rz.tw/PBdEq (chr1)
如果我要下載chr1的genome資料,是否把這邊所有的都下載再拼在一起就好了?
還有個疑問點是,好多的gap都是50,000的長度,不知為何會這樣(怎麼做出來的)?
另外一個問題是,人類genome大約有多少是coding,多少是noncoding的部分
我用很保守的估算 30000條基因*長的嚇死人的每條2k
所以30k*2k/3*10^9 人類coding的部分最多佔20%
請問這樣合理嗎?
PS:有看到佔1~1.5%的說法,
不過不知道這個估計值有沒有包含非a.a但有function的序列
以及有沒有把還沒有定序的gap考慮進去
請版友們指教^^
--
37m﹡
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 59.104.5.233
※ adu:轉錄至看板 Biotech 05/01 19:19