[問題] 有關Html Parser 的table問題

作者eddbloody (eddbloody)

看板java

標題[問題] 有關Html Parser 的table問題

時間Mon Apr 25 01:47:36 2011

最近因為在研究Parser 看板上蠻多推薦Html Parser，就開始研究了一下這套而我卻碰到了一個問題假如是單一的Tag，只要對個別處理就好但是遇到Tag裡面有Tag 就不太了解要怎麼做了.. 如 <table> <tr> <td><a>TEXT</a></td> </table> 我想要得知TEXT內容 P.S 我遇到的網頁很奇怪的<tr>沒有另外一組</tr> 但似乎使用TableTag時，沒遇到問題XD (不知道是不是運氣好剛好沒問題) 只會傻傻的用indexof + substring ，來硬作雖然可以解決問題，但是總覺得這樣硬作好像不太好感覺只要HTML在多點變化，就會發生問題所以來JAVA板問問各位高手有甚麼辦法可以找出TEXT內容以下為部分的程式碼(不太會排板所以用貼的XD) http://pastie.org/1828786 http://nopaste.info/dc49ee48cd.html P.S 另外想問一下總覺得我程式碼排版都有點亂當程式碼過長的時候，各位會怎樣分呢，還是直接一列這樣? 如: for(int k=0;k<((TableTag)(visitorList.getTags()[i])).getRows()[j]. getColumnCount();k++) 很少來JAVA板問，所以有點緊張XD 問題有點多請見諒@@ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 111.242.2.185 ※ 編輯: eddbloody 來自: 111.242.2.185 (04/25 01:51)

→ Dannvix:用多個變數把很長的那一行折解出來 04/25 14:19

→ Dannvix:例如 int columnCount = ...; 可以參考《Clean Code》 04/25 14:21

→ eddbloody:最後只好取出table的值在丟入LinkTag來處理~ 05/16 03:58