精華區beta RegExp 關於我們 聯絡資訊
請問各位前輩 假如網頁中出現的 pattern 如下: <div>中文<div id="iWantThisDiv">內容<div>其他內容</div></div>無關緊要</div> 主要就是有多層的 tag 出現 可是想要抓到 <div id="iWantThisDiv"> 裡面的全部內容 目前寫成 <div id="iWantThisDiv">([\s\S]+)</div> 會抓出 "內容<div>其他內容</div></div>無關緊要" 還是不太對 冏> 不知道有沒有更好的解法 先感謝各位哩 m(_ _)m -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 122.121.200.95
supertitler:tag內不要再有tag 12/10 02:33
ppcat:html 不是我寫的阿 冏> 我只是要爬內容~"~ 12/10 10:31
supertitler:..........又看錯了,請忽略我(泣) 12/10 11:12
giacch:<div id="iWantThisDiv">([^<]+)</div> 12/10 11:25
bigair:樓上的抓法沒辦法符合原PO要求 ~_~ 12/10 11:49
SKL:/<div id="iWantThisDiv">((<.+?>.*?<\/.+?>|.)*?)<\/div>/s 12/13 05:26
cutecpu:推樓上,超強! 12/15 08:11
> -------------------------------------------------------------------------- < 作者: cutecpu (可愛中央處理器) 看板: RegExp 標題: Re: [問題] 多層 html tag 的比對問題 時間: Wed Dec 10 10:03:46 2008 用perl寫的 http://src.wtgstudio.com/?sn2nK9 ※ 引述《ppcat (忙碌)》之銘言: : 請問各位前輩 : 假如網頁中出現的 pattern 如下: : <div>中文<div id="iWantThisDiv">內容<div>其他內容</div></div>無關緊要</div> : 主要就是有多層的 tag 出現 : 可是想要抓到 <div id="iWantThisDiv"> 裡面的全部內容 : 目前寫成 <div id="iWantThisDiv">([\s\S]+)</div> : 會抓出 "內容<div>其他內容</div></div>無關緊要" : 還是不太對 冏> : 不知道有沒有更好的解法 : 先感謝各位哩 m(_ _)m -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.220.169.2 ※ 編輯: cutecpu 來自: 61.220.169.2 (12/10 10:10)
ppcat:感謝分享~ 12/10 10:31