看板 Python 關於我們 聯絡資訊
請問各位 我使用以下的 code 想要爬一篇多頁面的Review網站文字 結果是可以爬出來,但每一頁的文字都會被重複爬取2~3次 造成最後爬出來的結果文字數量是超級爆炸多 想請問我的code 是哪邊有問題? 謝謝各位 code分享連結: https://ideone.com/493g7j 爬取頁面: https://reurl.cc/7K01b9 Note: code裡面的 URL 我是使用動態產生的網址變數 "initial_url" -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 211.21.153.61 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1745138403.A.A5A.html
shadowjohn: 你可能要限制只抓 div class='entry' 裡的所有 p 04/20 18:38