看板 Perl 關於我們 聯絡資訊
※ 引述《aminoacids (胺基酸)》之銘言: : 打擾了..... : 假設是在某檔案 % new < Genome10.fasta 執行下 : > gi|10795382|gb|DV732100.1|DV752100 102s Arabid.......英文 其後為AGTC序列 : ---------- : 問一 只想得到虛線部分 : 問二 只想得到102d以後開始部分 (不包括DNA序列) : while (<STDIN>) { : if : 後面要怎麼表示才能得到所求呢 : 新手 第一次問問題 還請多多包含 m (_ _) m @splistr = split /gb\||\|/, $line; print @splistr[1]; 看起來你也是為了fasta而傷神的bioinformatist -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.114.96.144
cot123:這個regexp會抓出10795382吧 06/07 17:58
tear2001:不會ㄚ 06/09 14:04
tear2001:寫成split /gi\||\|/, $line; 才會吧 06/09 14:05
tear2001:不過我不確定那個".1"能不能如期取出就是了 06/09 14:05
cot123:以gb\|或\|當作分隔來切 那就會變成 "gi" "10795382" 06/11 04:32
cot123:index為1 就是10795382啊 你要不要試試看啊? 06/11 04:33
cot123:不過我覺得fasta file還是用Bio::SeqIO比較快些 比較方便 06/11 04:35