作者wy90241 (wy90241)
看板Biotech
標題[求救] RNA seq DEG分析
時間Mon Dec 25 23:32:37 2017
大家好最近在分析轉錄體資料有一些疑問
實驗室之前有做RNA-seq,留下了database
物種為沒有reference genome的魚類,實驗流程為
sequencin >> De novo assembly(trinity) >> Bowtie2跟RSEM進行定量
目前想從資料庫撈某幾個有興趣的基因,看表現量上的差異
但分析後發現,同一個annotation的結果會對應到不只一個unigene
上網爬文有找到別人也有類似的問題
https://www.google.com.tw/amp/s/www.researchgate.net/post/Why_do_I_get_multipl
e_contigs_with_same_annotation_in_transcriptome_analysis/amp
討論串的回覆是有可能為isoforms,或來自同個基因的不同片段
可以用軟體的方式來解決這個問題。
我的問題是:
1.可以取片段長度最長unigene當作代表嗎?
2.是否一定要用其他軟體分析?
我是覺得利用其他軟體進行分析(目前知到的有Corset)會比較好
但目前無法獨自完成
不知道大家有沒有甚麼建議或是其他辦法
目前對生物資訊還不太熟,再請大家不吝指正
非常感謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.121.71.219
※ 文章網址: https://www.ptt.cc/bbs/Biotech/M.1514215960.A.9FF.html
※ 編輯: wy90241 (140.121.71.219), 12/25/2017 23:33:42
※ 編輯: wy90241 (140.121.71.219), 12/25/2017 23:35:32
※ 編輯: wy90241 (140.121.71.219), 12/25/2017 23:36:10
※ 編輯: wy90241 (140.121.71.219), 12/25/2017 23:36:35
推 lelojack: 可能是isoform/gene duplication, 生物資訊是一種分析 12/26 07:49
→ lelojack: 策略,在genome未知之前,軟體跟挑選策略都是間接證據 12/26 07:49
推 lelojack: 所以論文都不會講怎麼挑選,因為講明了只會製造更多紛 12/26 07:53
→ lelojack: 爭,倒不如用其他證據證明挑的是正確 12/26 07:53
推 lelojack: 1.用片段最長的當代表是常用的做法, 只要後續的實驗或 12/26 21:27
→ lelojack: 推論合理即可 2.在Genome未知的狀況下,沒有軟體可以 12/26 21:27
→ lelojack: 提供正確答案 12/26 21:27
→ wy90241: 了解,感謝L大的建議與討論! 12/27 00:02
→ wy90241: 就想說奇怪,看了好幾篇論文怎麼都沒說是用什麼來當判定 12/27 00:05
→ wy90241: 的標準,感謝解惑! 12/27 00:05