作者killerjackal (比利養了一隻狗叫比利)
看板Perl
標題[請益] 字串部分比對
時間Fri Jan 27 11:39:04 2012
現在手邊有兩個檔案
檔案的格式都差不多長一樣
>xxxxxxx(title)xxxxxxxxx
stringstringstringstring......
A檔案格式如下:
>UniqueRead1_count1
CTCGCCGTCGCAAACCCAAGCTGTCT
>UniqueRead2_count1
CTCGCCTGGCTGTGGTTCTTCTAACA
>UniqueRead3_count1
CTCGCCTGCTAAGCGTTGAGATCATC
B檔案如下:
>UniqueRead1_count1
CTCGCCCCCCCAAAAAAAACAAAAACGCCTCATACGAGATTATCAATTAGCTAAGTTGGTAATGTG
>UniqueRead2_count1
CTCGCCGCCAGTAACATTCATTTACGTTTTATCATATATTTGATTTCTTGCTTTTATTCCATTTAT
>UniqueRead3_count1
CTCGCCTCCTATTCTTCCCGCCACTTCTTGCTTGACCAACAACCTCAGCTCTCATCACTCACCTGG
目的是要看A檔案出現的內容是否也在B檔案中出現過
意思就是說如果A檔案的第一筆資料(資料內容)
>UniqueRead1_count1(此為資料名稱)
CTCGCCGTCGCAAACCCAAGCTGTCT (此為資料內容)
這資料內容如果有在B檔案的任一部分出現的話,就記錄一次
(記錄過就換下一筆A檔案中的資料)
這樣應該要怎麼下手比較好?
有請各位高手賜教了
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 70.185.98.109
→ Godkin:看起來像是ngs的資料~ 01/27 13:13
→ imce:用grep試試看囉 01/27 14:40
→ ontario:所以是>UniqueRead1_count1不比...只比CTCGCCCC... ? 01/28 11:11
→ killerjackal:是的 只比資料內容 01/31 12:34