作者collin2315 (梭哈!)
看板perl
標題[問題] 關於regular expression
時間Thu Aug 16 02:11:41 2007
要把html中的tag以及被標籤的文字皆去除,應該如何表示才對?
句子的形式如下:
<font color = "red"><B>E2F-1</B></font> can also ...
<font color = "blue"><B>induce</B></font> of ...
<font color = "green"><B>p73</B></font> is a ...
欲得到:
can also ...
of ...
is a ...
使用$sentence =~ s/<[^>\w]*>//g; 卻無法將E2F-1、induce、p73去除
請問正規表示法應如何寫才能將被標籤的文字去除,留下剩下非標籤的文字
感謝
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.228.75.109
推 PsMonkey:等等... 那就什麼都不會剩下了耶? 08/16 02:21
→ PsMonkey:直接回傳一個空字串會不會比較實在.... XDXD 08/16 02:21
→ collin2315:抱歉..沒說清楚 句子中不只這些標籤還有其他的字 08/16 02:30
→ reizarc:$string =~ s/<[^><]>//g; 08/16 02:58
※ 編輯: collin2315 來自: 61.228.75.109 (08/16 03:18)
推 david220:單純看你的測資是 $str =~ s/\<.+\>\s*//g; 就可以了 XD 08/16 11:42
推 collin2315:謝謝^^ 08/17 15:58