作者tear2001 ( Play ball !!)
看板perl
標題Re: [問題] 新手想問個例題...
時間Thu Jun 7 14:00:05 2007
※ 引述《aminoacids (胺基酸)》之銘言:
: 打擾了.....
: 假設是在某檔案 % new < Genome10.fasta 執行下
: > gi|10795382|gb|DV732100.1|DV752100 102s Arabid.......英文 其後為AGTC序列
: ----------
: 問一 只想得到虛線部分
: 問二 只想得到102d以後開始部分 (不包括DNA序列)
: while (<STDIN>) {
: if
: 後面要怎麼表示才能得到所求呢
: 新手 第一次問問題 還請多多包含 m (_ _) m
@splistr = split /gb\||\|/, $line;
print @splistr[1];
看起來你也是為了fasta而傷神的bioinformatist
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.114.96.144
推 cot123:這個regexp會抓出10795382吧 06/07 17:58
推 tear2001:不會ㄚ 06/09 14:04
→ tear2001:寫成split /gi\||\|/, $line; 才會吧 06/09 14:05
→ tear2001:不過我不確定那個".1"能不能如期取出就是了 06/09 14:05
→ cot123:以gb\|或\|當作分隔來切 那就會變成 "gi" "10795382" 06/11 04:32
→ cot123:index為1 就是10795382啊 你要不要試試看啊? 06/11 04:33
→ cot123:不過我覺得fasta file還是用Bio::SeqIO比較快些 比較方便 06/11 04:35