推 caty1010:跟我想的一樣~~~good 06/06 00:27
※ 引述《iduhc (菠蘿麵包)》之銘言:
: 目前不知道在html標籤中遇到javascript時要如何做處理
: 這邊是要做處理的網頁: http://khh.travel/tw/spots/RecSpotList.aspx
: 當我用普通瀏覽器時,只要單純的按下"下一頁"的按鈕即可
: 可是到java上如何做???
: 目前已經能夠抽取出html原始碼中的 href="javascript:__doPostBack('First','')
: 請問各位大大接下來要怎麼做?
: --------------------------------------------------------------------
: 我是想用java做處理而不是javascript或html語法,所以應該不算問錯版吧
: ps1.我是想要得到類似我們按下一頁時所得到的頁面,
: 然後蒐集各個景點的資訊(這部份我已經完成了)
: 所以我的主要問題是在於如何做前往"下一頁"這個動作
: ps2.當我按下一頁後為什麼出現的網址還是跟上一頁的一樣?
: 不過原始擋內容已經變了
: 這是javascript的效果嘛?
首先,你必須自行打開此網頁的原始檔,看看 __doPostBack 這個 JavaScript 函數
在做什麼。
以您提供的網頁為例,這個函數用來填寫 Form1 這個表單裡面的欄位,然後提交
(submit) 此表單給 RecSpotList.aspx ,因為瀏覽器提交表單用的是 POST方法,
所以網址列並沒有看到表單所填寫的資料 (請自行 Google : http post get)。
你要做的事情就是用 Java 寫個程式代替瀏覽器提交 Form1 這個表單,如果你已經
知道如何對伺服器發送 HTTP 請求,並回傳一份網頁,那提交表單的作法應該很容易
就查得到。
在此推薦 HTMLParser (http://htmlparser.sourceforge.net/) 與
HttpClient (http://hc.apache.org/httpcomponents-client-ga/) 搭配使用。
HTMLParser 用來剖析網頁原始碼,而 HttpClient 用來處理 HTTP 通訊。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 223.142.18.224