作者hazton (hazton)
看板Python
標題Re: [問題] 抓資料被檔@@
時間Sat Sep 26 03:40:11 2009
http://planet.python.org.tw/planet/user/4/tag/python/
我在上面這個網站有找到大概想要的東西
不過直接執行卻會出現下面這個訊息:
<addinfourl at 60282000 whose fp = <socket._fileobject object at 0x039023F0>>
程式碼如下:
# -*- coding: utf-8 -*-
import urllib
import urllib2
def GetURLContent(url):
req=urllib2.Request(url)
#req.add_header('User-Agent','Mozilla/5.0 (Windows; U; Windows NT 5.1;
en-US; rv:1.6) Gecko/20040113')
req.add_header('User-Agent','Mozilla/5.0 (Windows; U; Windows NT 5.1;
zh-TW; rv:1.9.0.11) Gecko/2009060215')
req.add_header('Referer','
http://tw.yahoo.com/')
return urllib2.urlopen(req)
data = GetURLContent("
http://tw.yahoo.com/")
print data
有人知道上面的錯誤訊息代表什麼意思呢?該如何解決?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.116.142.78
推 buganini:這不是錯誤訊息 請把WretchGrabPhoto.py看完 09/26 05:07
→ hazton:哦哦,原來是沒加.read()阿!現在可以跑了~感謝! 09/26 17:33
→ hazton:不過看來還是無法突破yahoo的門,看來還是要另外想辦法嚕 09/26 17:42
推 Lucemia:cookie 與host可能有檢查 09/28 04:04
→ hazton:所以host用程式是沒辦法改嚕@@? 09/28 11:18
推 buganini:host cookie都是header的一部分 自己查好格式塞進去即可 10/15 00:00