作者flywindy2002 (巧克力)
看板Python
標題[問題] Python抓露天網頁的疑問
時間Tue Mar 1 15:13:59 2011
大家好~
小女子是研究Python的超級新手>"<
之前本來有用JAVA寫抓網頁的程式
但是因為效能問題和露天抓不到(不知道是被檔還是什麼)
所以正在研究Python抓露天
想先測試一下
所以寫了以下簡單的程式
import urllib2
page = urllib2.urlopen('http://www.ruten.com.tw/')
for line in page:
print line
當網址是YAHOO和GOOGLE都沒問題
但是改成露天就會出現以下的問題
Access Deny!! Detect your Browser to install malicious plug-in or Illegal
access. (A999)
嘗試Google了一下也找不到答案
希望能有高手幫忙解惑 Q_Q
非常感謝!!!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.43.225.93
→ uranusjr:就被檔了吧...試試看 mechanize 能不能騙過 03/01 16:03
→ Holocaust123:修改header看看, 不要用urllib2預設的 03/01 16:49
推 hukhuk:你拿wireshark看一下payload裡的header 03/03 14:07