[問題] 字串段落尋找

作者ffrr ( )

看板Linux

標題[問題] 字串段落尋找

時間Thu Apr 10 11:35:37 2014

請問版友要怎麼取得Html文字中的某個區段內容例如內容如下 <head> <li><a href="#01">XXXXXX</a></li> <li><a href="#02">YYYYYY</a></li> </head> <head> <li><a href="#01">MMMMMM</a></li> <li><a href="#02">NNNNNN</a></li> </head> 要怎麼取得第二組head內中的資料，例如取得 <li><a href="#01">MMMMMM</a></li> <li><a href="#02">NNNNNN</a></li> 目前的處理方式是用grep "MMMMMM" 跟grep "NNNNNN" 但是因為MMMMM跟NNNNN會變動，所以不好處理想請問有沒有方式可以用<head>跟</head>當成標記來處理字串的方式呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.173.167.3 ※ 文章網址: http://www.ptt.cc/bbs/Linux/M.1397100944.A.FD4.html

→ x2006:grep href=\"#0 filename 04/10 12:03

→ x2006:grep href=\"#0[12] filename 04/10 12:08

→ x2006:sed -n '3,4p' 04/10 12:15

→ rellik:看看 grep -C 3 "MMMMMM" 能不能符合你的需求 04/10 16:21

→ soem:cat test.html | sed '1,/<\/head>/d' 04/10 21:55

→ soem: (承上) | sed -e '/^.*<head>/ d' -e '/<\/head>.*$/ d' 04/10 21:55

推 cspy:Awk 設定字首字尾 04/10 23:49

→ ffrr:謝謝版友們 ^_^ 04/14 11:13