看板 Perl 關於我們 聯絡資訊
關於這個問題 我知道可以用正規式直接去實做 但是對於正規式的使用還沒有很透徹的了解 想問看看是否有相關的HTML module可以把html tag消除掉 只留下tag跟tag中的內容 (有到cpan網站中去找 但是資料過於龐大 找得很沒頭緒) 或者有人可以跟我講 如何利用正規式去實做嗎? 有查到可用<(.| )*?>去消除所有的HTML Tag 但是消除後的文字Home與Test連在一起....希望能做到分開的效果 或者是結果儲存在一個陣列當中 謝謝 HTML Example: <a href="http://127.0.0.1">Home<span>Test</span></a> 須將Home跟Test抓出來 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.232.66.53
deh3215:1904篇看看也許有點幫助..我用HTML::TreeBuilder清除所有 04/03 01:53
deh3215:tag...這個模組算清的蠻乾淨的 04/03 01:53
deh3215:HTML::Strip也可,把那串文字存成txt檔,讀進來用HTML:: 04/03 02:11
deh3215:Strip可清除掉tag,剩下 Home Test 04/03 02:12