作者b60413 (None)
看板Perl
標題[問題] 如何消除html tag
時間Fri Apr 3 00:52:39 2009
關於這個問題 我知道可以用正規式直接去實做
但是對於正規式的使用還沒有很透徹的了解
想問看看是否有相關的HTML module可以把html tag消除掉
只留下tag跟tag中的內容
(有到cpan網站中去找 但是資料過於龐大 找得很沒頭緒)
或者有人可以跟我講 如何利用正規式去實做嗎?
有查到可用<(.| )*?>去消除所有的HTML Tag
但是消除後的文字Home與Test連在一起....希望能做到分開的效果
或者是結果儲存在一個陣列當中
謝謝
HTML Example:
<a href="
http://127.0.0.1">Home<span>Test</span></a>
須將Home跟Test抓出來
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 118.232.66.53
→ deh3215:1904篇看看也許有點幫助..我用HTML::TreeBuilder清除所有 04/03 01:53
→ deh3215:tag...這個模組算清的蠻乾淨的 04/03 01:53
→ deh3215:HTML::Strip也可,把那串文字存成txt檔,讀進來用HTML:: 04/03 02:11
→ deh3215:Strip可清除掉tag,剩下 Home Test 04/03 02:12