[問題] 抓取網頁html source code?

作者smilekerker (科科:))

看板Python

標題[問題] 抓取網頁html source code?

時間Fri Jan 23 18:10:04 2015

剛要學怎麼抓網頁source code 再來解析自己要的資訊結果第一步抓code就死掉了= = 譬如我想抓的網頁是PCHOME 股市的某頁 http://pchome.megatime.com.tw/rank/sto0/ock03.html 然後寫了這個小程式 http://imgur.com/cMjJRCR 但是回傳只有這樣的訊息 http://imgur.com/UWLSyIH 請問這樣是哪裡有錯誤嗎? 還是這網頁不能這樣讀? 麻煩指點一下謝謝 :) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.116.187.212 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1422007806.A.A3C.html

→ uranusjr: 網上搜尋 ajax 01/23 18:53

→ smilekerker: 這是ajax的特殊語法嗎? 那我再去查查謝謝 :) 01/23 19:16

推 secondsee: 這個網址就是只會吐這段html給你,你所看到的東西是因為 01/23 19:23

→ secondsee: browser去執行了裡面的javascript改寫到了原本的body 01/23 19:24

→ smilekerker: 好的，看來是這樣QQ，那有其他快速簡潔的方法可以 01/23 19:36

→ smilekerker: 獲得原始碼的嗎? 01/23 19:36

→ secondsee: urllib2.urlopen(url,'is_check=1').read() 01/23 19:48

→ smilekerker: 居然這麼簡單!! 萬分感謝!! 01/23 19:52