作者smilekerker (科科:))
看板Python
標題[問題] 抓取網頁html source code?
時間Fri Jan 23 18:10:04 2015
剛要學怎麼抓網頁source code
再來解析自己要的資訊
結果第一步抓code就死掉了= =
譬如我想抓的網頁是PCHOME 股市的某頁
http://pchome.megatime.com.tw/rank/sto0/ock03.html
然後寫了這個小程式
http://imgur.com/cMjJRCR
但是回傳只有這樣的訊息
http://imgur.com/UWLSyIH
請問這樣是哪裡有錯誤嗎?
還是這網頁不能這樣讀?
麻煩指點一下
謝謝 :)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.116.187.212
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1422007806.A.A3C.html
→ uranusjr: 網上搜尋 ajax 01/23 18:53
→ smilekerker: 這是ajax的特殊語法嗎? 那我再去查查 謝謝 :) 01/23 19:16
推 secondsee: 這個網址就是只會吐這段html給你,你所看到的東西是因為 01/23 19:23
→ secondsee: browser去執行了裡面的javascript改寫到了原本的body 01/23 19:24
→ smilekerker: 好的,看來是這樣QQ,那有其他快速簡潔的方法可以 01/23 19:36
→ smilekerker: 獲得原始碼的嗎? 01/23 19:36
→ secondsee: urllib2.urlopen(url,'is_check=1').read() 01/23 19:48
→ smilekerker: 居然這麼簡單!! 萬分感謝!! 01/23 19:52