→ supertitler:tag內不要再有tag 12/10 02:33
→ ppcat:html 不是我寫的阿 冏> 我只是要爬內容~"~ 12/10 10:31
→ supertitler:..........又看錯了,請忽略我(泣) 12/10 11:12
→ giacch:<div id="iWantThisDiv">([^<]+)</div> 12/10 11:25
→ bigair:樓上的抓法沒辦法符合原PO要求 ~_~ 12/10 11:49
推 SKL:/<div id="iWantThisDiv">((<.+?>.*?<\/.+?>|.)*?)<\/div>/s 12/13 05:26
推 cutecpu:推樓上,超強! 12/15 08:11
> -------------------------------------------------------------------------- <
作者: cutecpu (可愛中央處理器) 看板: RegExp
標題: Re: [問題] 多層 html tag 的比對問題
時間: Wed Dec 10 10:03:46 2008
用perl寫的
http://src.wtgstudio.com/?sn2nK9
※ 引述《ppcat (忙碌)》之銘言:
: 請問各位前輩
: 假如網頁中出現的 pattern 如下:
: <div>中文<div id="iWantThisDiv">內容<div>其他內容</div></div>無關緊要</div>
: 主要就是有多層的 tag 出現
: 可是想要抓到 <div id="iWantThisDiv"> 裡面的全部內容
: 目前寫成 <div id="iWantThisDiv">([\s\S]+)</div>
: 會抓出 "內容<div>其他內容</div></div>無關緊要"
: 還是不太對 冏>
: 不知道有沒有更好的解法
: 先感謝各位哩 m(_ _)m
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.220.169.2
※ 編輯: cutecpu 來自: 61.220.169.2 (12/10 10:10)
推 ppcat:感謝分享~ 12/10 10:31