作者valda (valda)
看板RegExp
標題[問題] 請教關於擷取網址內容
時間Tue Jun 30 09:40:56 2009
要利用VB.NET於HTML標籤式語言中截取出
<a href="
http://XXXXXX" class="medium">yyy</a>
請教個位高手該如何撰寫~這問題困擾我很快一天了
感謝
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 59.104.44.70
> -------------------------------------------------------------------------- <
作者: lg31cm (我住5F) 看板: RegExp
標題: Re: [問題] 請教關於擷取網址內容
時間: Sat Jul 4 00:56:06 2009
※ 引述《valda (valda)》之銘言:
: 要利用VB.NET於HTML標籤式語言中截取出
: <a href="http://XXXXXX" class="medium">yyy</a>
: 請教個位高手該如何撰寫~這問題困擾我很快一天了
: 感謝
分成兩步驟對你來說可能比較容易
pass1: 取出<a...>...</a>
<a\b([^>]+)>(.*?)</a>
pass2: 取出 href="..."
\bHREF\s*=\s*(?:"([^"]*)"|'([^']*)'|([^'">\s]+)
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 122.124.98.45
推 akindpepe:大大,請問一下在PHP裡面的正規式要怎麼下? 07/08 18:00
→ akindpepe:因為我在PHP裡下<a\b([^>]+)>(.*?)</a>的話會有錯誤 07/08 18:02
→ akindpepe:錯誤碼是preg_match() Unknown modifier ']' 為什麼呢? 07/08 18:03
推 bcse:PHP的regex要寫成像是這樣的字串'/****/',必須有前後的斜線 07/10 00:03
→ lg31cm:沒錯,因為PHP想相似Perl的語法 07/11 03:27