作者bmzz (告白當然要唱這首歌)
看板Python
標題Re: [問題] 關於抓取網頁資料
時間Sun Jun 28 19:41:04 2009
※ 引述《lauer (Enjoy it)》之銘言:
: 不好意思第一次想嘗試抓網頁資料
: 一般的網頁知道怎麼去抓取,我是用最簡單的 urllib.urlopen('..')
: 然後再找出我要的關鍵字
: 但是有的網頁如果直接連的話
: 就會出現 "You do not have a session." 的訊息
: 請問這該如何解決呢?
: 麻煩大家了,謝謝!
可能用wireshark或是firefox去觀察一下http的headers
通常是加個Referer就會過了
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.217.30.161
推 lauer:謝謝解說~不過 不是很懂@@ Referer? 方便再多點資訊嗎~ 06/28 20:00
→ monmo2:所謂的Referer就是從一個url連過來的資訊。 06/28 23:07
→ monmo2:若你從 A連到B。 則你把會A url referer資訊帶著到B .. 06/28 23:08