作者lin25 (鯊魚~!)
看板java
標題[問題] 如何抓取網頁上的文字
時間Mon Feb 16 11:27:05 2009
因為小弟的論文有一部份要用到抓取網頁文字的java程式
所以參考了很多人寫的抓取網頁文字程式
目前看過的方法是透過分析網頁的html檔之後 再將文字過濾出來
但是現在的問題點就是我想要抓取的網頁文字不在該網頁的html檔裡
像是Gmap幫你做的路線規劃
圖:
http://f8.wretch.yimg.com/noobking0/5/1768420813.jpg
紅色框起來的部份
(抱歉 我不是藉此宣傳我的相簿 我是真的不會縮圖 )
現在想請問板上有沒有人可以教我不用透過分析html的方式
或是告訴我哪本書的內容有教直接抓取網頁文字的方法
我想盡快解決這問題
另外 我想要順便問板上大眾要如何提升自己的java程式能力
之前我是找一本java書 一個章節一個章節自修
但是目前我的程式功力只能把別人寫的程式組合起來成一個怪物
自己看自己的程式都感到心寒 所以一直想要突破
請大家好心回答我的問題吧
感恩
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.129.19.118
推 qrtt1:default "Forbidden" response (403) 02/16 11:50
推 PsMonkey:最後的問題:從 Refactory 開始 02/16 13:10
推 adrianshum:樓上: 是 Refactor/Refactoring 吧? 02/16 14:17