作者cobrasgo (人魚線變成鮪魚線,超帥)
看板Python
標題[問題] 抓證交所網頁資料
時間Sat Jun 20 13:39:31 2015
大家好
我現在想抓這個網頁的資料
http://info512.taifex.com.tw/Future/FusaQuote_Norl_Top1.aspx
左上角有個每頁顯示筆數
我想抓的是"全部"
我用wireshark抓了封包
試著送出類似的內容
但是因為對網頁技術苦手
一直無法抓到全部的資料(我猜是post body的資料有誤)
小弟的程式碼如下
http://pastie.org/10249845
可以請網頁高手指點一下嗎?
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.108.229
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1434778774.A.998.html
→ arthur104: header要給User Agent和Cookie 06/20 22:29
→ arthur104: post data要給__VIEWSTATE和Pagesize那個 06/20 22:29
→ cobrasgo: 抓到了,謝謝。請問一下那個__VIEWSTATE是幹嘛用的? 06/21 11:57
→ Azraelx: 不知道符不符合您的需求 06/22 23:45