看板 Python 關於我們 聯絡資訊
用beautifulsoup想爬steam 上對遊戲的關鍵字評論 網址如下 http://steamcommunity.com/games/dota2/announcements/detail/1449457773770927103 comment 一頁十筆,在爬的時候只能抓取得到第一頁的內容 第二頁的評論以後不知從何爬起,不是很了解資料放在哪 另外 這部分有推薦用書可以查嗎 感覺不知道網頁怎麼寫,要爬資料問題一堆 又毫無頭緒.... 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 173.56.84.230 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1511765781.A.28B.html
ckc1ark: 從developer panel可以看ajax url怎麼下 11/27 15:03
ckc1ark: 他是包在json的comment_html欄位 11/27 15:04
Mutibil: 又麻煩你了orz 一堆報告要爬蟲分析... 11/27 15:06
ckc1ark: 看起來沒有特別檢查 https://tinyurl.com/y8kbxrar 11/27 15:11
ckc1ark: 改start就可以撈別頁了 11/27 15:12
vi000246: 用F12看Netwrok頁籤 看翻頁時會執行的request 11/27 17:04
s960405s: 用selenium吧 11/28 13:43
Mutibil: 因為覺得有些筆數很大 selenium會慢了些 11/28 13:48