作者mythfrank (jonesking)
看板java
標題[問題] 如何把HTML轉成XML?
時間Mon Feb 8 12:49:03 2010
小弟目前遇到的問題是
在Java中parser HTML讓他產生dom tree
都會有沒有清完的tag之類的
所以我就想說把它轉成XML 來被parser
然後看了一下
請問一下Java要用什麼jar可以把yahoo那種首頁
也可以轉成XML呢?
所以想問
1.大家都是怎麼用Java parser html的?
如果可以告訴我範例和Source code
那真是感激不盡
2. HTML轉XML如果要用Java做 請問大家如何實作呢?
如果有大大願意完整解答 小弟願意出5000p幣報答
Orz 不是用這帳號寄
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.129.20.18
→ ogamenewbie:你要不要先搞清楚 html 跟 XML 差在哪邊... 02/08 12:53
→ uziel:也許你應該先Google一下"htmlparser" 02/08 13:07
→ PsMonkey:只能說最近心腸比較好,以前的話,大概就作業文條款掰了 02/08 13:28
→ TonyQ:怎麼不乾脆用html tidy清成xhtml 好了 @_@ 02/08 14:50
→ adrianshum:parser是名詞, parse 才是動詞... 02/08 15:18
推 yyc1217:他有問要用什麼jar檔 雖然不是直接問要用哪個lib... 02/08 15:58