作者left (881 forever)
看板Python
標題[問題] crawl http://www.netgear.com/
時間Wed Jun 25 09:11:51 2014
問一下各位高手
因為被指定一個task
就是crawl
http://www.netgear.com/
這個網站裡面的相關資訊,就是給一個關鍵字
然後把文章拉出來
因為裡面有一個search bar可以提供搜尋
我的想法是:
先鍵入關鍵字後
再從他的吐出來的結果,在去抓網址然後再下載thread
可是吐出來的結果完全找不到網址
各位大大有什麼好的想法與建議嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.218.124
※ 文章網址: http://www.ptt.cc/bbs/Python/M.1403658714.A.0EF.html
→ uranusjr:因為它的結果是用 AJAX 插入的, 稍微搜尋一下相關資料吧 06/25 10:35
→ huggie:麻煩一點,要直接找到他 AJAX 運作的 HTTP method & URL 06/29 12:00
→ huggie:或者可能簡單點直接用 Selenium 驅動 browser 06/29 12:02