看板 Biotech 關於我們 聯絡資訊
大家好, 請問版上有沒有做過 4C-seq 或其他高通量定序的前輩? 我手上有一筆 4C-seq 的數據, 它是原始的定序資料 (fastq), 我要怎麼把這筆資料和 genome 的序列做 alignment? 我上網搜尋軟體但是找到的軟體都不知道要怎麼使用, 我的作業系統是 Windows 7 x64, 希望版上有做過高通量定序資料分析的前輩能教我 要用什麼軟體分析定序的原始資料, 或是在 Wondows 作業系統下那些軟體要怎麼使用? 謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 120.126.39.94 ※ 文章網址: https://www.ptt.cc/bbs/Biotech/M.1467882065.A.1C4.html
sunorange: 4C的重點不是alignment,要找到酵素切位和對應的序列07/07 17:13
這個 4C 的實驗是我自己設計的, 所以我知道 viewpoint (VP)用的酵素和 primer 序列, 只是我現在要用 sequencing 的 raw data 去找 VP 跟哪些地方有 interaction, 所以我要把去掉 primer 序列後的 reads 序列去跟 genome 做 alignment, 找出有 interaction 的區域。 所以我想請問有沒有軟體能夠讓我把 genome 序列和 4C-seq 資列丟進去後, 自動幫我把 reads 放到 genome 上並做出在 paper 看到的那種圖。 像這種的: http://goo.gl/HpkZyl http://goo.gl/q2jJFL 感激不盡! ※ 編輯: xxtomnyxx (120.126.39.94), 07/07/2016 17:26:25
Ianthegood: 所以你應該是先跑alignment 接下來才用另外的program07/07 19:29
Ianthegood: 來visualise07/07 19:29
Ianthegood: paper應該有寫用什麼程式跑吧 一般都要用cluster跑07/07 19:30
Ianthegood: 用pc大概一個run要跑兩個禮拜07/07 19:30
Ianthegood: 版上esh前輩有出一本入門書不貴 值得投資 07/07 19:33
jabari: 一個run兩個禮拜 debug完再兩個禮拜... 超棒Q口Q07/07 22:50
哇哩咧!為什麼會需要兩個星期啊 QAQ 難到要我自己用組合語言寫一個程式來 alignment 嗎...... ※ 編輯: xxtomnyxx (111.80.92.137), 07/07/2016 23:04:46
lingon: 上galaxy 找tool 幫你做 07/07 23:05
jabari: 看運氣囉 我上一批raw要給美國合作單位用 掛ftp給他們載了 07/08 00:09
jabari: 半天..囧 07/08 00:09
Ianthegood: 你如果可以用assembly寫出打敗各家高階的程式還真是 07/09 16:56
Ianthegood: 造福大家!!! 07/09 16:56
Ianthegood: 總之也就是把每一條read拿去blast整個genome嘛 07/09 16:57
所以在 PC 上真的沒救了嘛 QAQ 個人是覺得這種分析軟體真的得用組語寫, 看過 C++ 或其它物件導向語言編譯成組語後的樣子, 也難怪 PC 上的程式有夠沒效率.... 只是不管我怎麼算, 這程式都會把記憶體塞爆啊! 光 mouse genome 塞進去就快 3G 了...... ※ 編輯: xxtomnyxx (114.44.24.77), 07/10/2016 00:19:05
lingon: 上amazon 上面找個aligner instance,要不去找galaxy 07/10 02:26
lingon: 很多aligner早已用過assembly最佳化過,要做分析就先看看 07/10 02:29
lingon: 領域裡面有什麼工具早可以用了,不需要重新發明輪胎 07/10 02:30
lingon: 也不想PC在分析基因體序列資料能有多大的用途 07/10 02:32
jabari: 如果不是de novo 有模板的還有救...不過你ˊ作4c 07/10 02:49
Ianthegood: 所以我們都借cluster其實是借記憶體啊XD 07/14 04:43