作者eddbloody (eddbloody)
看板java
標題[問題] 有關Html Parser 的table問題
時間Mon Apr 25 01:47:36 2011
最近因為在研究Parser
看板上蠻多推薦Html Parser,就開始研究了一下這套
而我卻碰到了一個問題
假如是單一的Tag,只要對個別處理就好
但是遇到Tag裡面有Tag
就不太了解要怎麼做了..
如
<table>
<tr>
<td><a>TEXT</a></td>
</table>
我想要得知TEXT內容
P.S 我遇到的網頁很奇怪的<tr>沒有另外一組</tr>
但似乎使用TableTag時,沒遇到問題XD
(不知道是不是運氣好剛好沒問題)
只會傻傻的用indexof + substring ,來硬作
雖然可以解決問題,但是總覺得這樣硬作好像不太好
感覺只要HTML在多點變化,就會發生問題
所以來JAVA板問問各位高手
有甚麼辦法可以找出TEXT內容
以下為部分的程式碼(不太會排板 所以用貼的XD)
http://pastie.org/1828786
http://nopaste.info/dc49ee48cd.html
P.S 另外想問一下
總覺得我程式碼排版都有點亂
當程式碼過長的時候,各位會怎樣分呢,還是直接一列這樣?
如:
for(int k=0;k<((TableTag)(visitorList.getTags()[i])).getRows()[j].
getColumnCount();k++)
很少來JAVA板問,所以有點緊張XD
問題有點多 請見諒@@
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 111.242.2.185
※ 編輯: eddbloody 來自: 111.242.2.185 (04/25 01:51)
→ Dannvix:用多個變數把很長的那一行折解出來 04/25 14:19
→ Dannvix:例如 int columnCount = ...; 可以參考《Clean Code》 04/25 14:21
→ eddbloody:最後只好取出table的值 在丟入LinkTag來處理~ 05/16 03:58