看板 Python 關於我們 聯絡資訊
大家好, 我目前剛開始藉Su Billy大大的簡單爬蟲教學video初學python爬蟲 遇到有個小問題, 就是我用request抓卦板的原始碼時 - res = request.get('https://www.ptt.cc/bbs/Gossiping/index.html') print(res.text) - 印出的原始碼跟實際卦板網頁的原始碼對不上, 而是顯示像是PTT入口頁面的內容 如下圖 https://imgur.com/gmTQFY9 BUT! 我用Salary, Tech_job跟表特等其他板測試, 卻都沒有問題@@ 想請問卦板的內容有何特殊之處嗎? 我對前端的html和CSS等語言完全不熟, 只學過基礎的python 望大家指教,謝謝板友Orz -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.234.94 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1516958933.A.B85.html ※ 編輯: DaKyu (140.112.234.94), 01/26/2018 17:30:43
uranusjr: Session 問題, 你 request 裡面沒按過那個 18 禁按鈕 01/26 17:31
謝謝u大提醒! 有google到相關解法了, 真的很謝謝你~~ ※ 編輯: DaKyu (140.112.234.94), 01/26/2018 17:54:54
leo850611: 貌似模擬Google爬蟲可繞過那個按鈕 01/27 17:14
penut85420: 可以用Selenium去點那個按鈕 01/29 14:25
galeondx: https://goo.gl/MKaCK6 03/06 04:36