[問題] 請教某些網站如何抓取爬蟲

作者zxcv4982543 (zxcv4982543)

看板Python

標題[問題] 請教某些網站如何抓取爬蟲

時間Sat Apr 21 18:20:13 2018

如題小弟是程式初學者最近在學爬蟲已經有抓學測研究所那種交叉查榜的資料(單一網頁) 目前想抓LOL的對戰紀錄網頁 https://matchhistory.tw.leagueoflegends.com/zh/#page/landing-page 但這網頁除了是用滾輪式網頁外裡面的每一筆對戰紀錄雖然左鍵點擊就能進去但右鍵或是 F12(chrome)找不到網頁相關的url(網頁包含每一場對戰代碼也找不到QQ) https://imgur.com/caFBDK9 現在目前已經會模擬瀏覽器下拉但就是網址的取得部分有困難想請問各位大大有什麼關鍵字或方法能交交我QQ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.214.64.48 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1524306016.A.B26.html

→ st9760916: 為啥要爬桶神的＝＝ 04/21 19:07

推 jn8029: selenium get_elements_by_css_selector click 04/21 19:36

推 vi000246: 你開F12 然後捲到最下面網頁會載入更舊的對戰紀錄 04/21 21:36

→ vi000246: 觀察一下call了什麼網址你直接複製那網址貼上 04/21 21:37

→ vi000246: 會得到所有對戰紀錄的json 04/21 21:37

→ vi000246: json裡的gameid 就是match-details網址後面接的數字 04/21 21:39

→ vi000246: 就能找到你要的頁面了 04/21 21:39

推 coeric: 給一樓，這要給人家推一下阿 XDDDD 04/23 10:25

→ coeric: 有個目的來學爬蟲，這樣才有動力會快阿..... 04/23 10:26