[問題]Selenium沒辦法爬 MOMO購物網

作者a6409tw (爆蠑螈)

看板Python

標題[問題]Selenium沒辦法爬 MOMO購物網

時間Sat Dec 8 21:51:50 2018

各位大大好如題小弟發現MOMO購物網有使用JS渲染所以我使用Selenium Chromedriver的Headless方式去抓取商品品名、價格、商品網址可是不管用什麼方式都沒辦法爬下來Q 以下是我的Code from selenium import webdriver from bs4 import BeautifulSoup options = webdriver.ChromeOptions() options.add_argument('headless') driver = webdriver.Chrome(executable_path = r'/Users/syu/Downloads/chromedriver',chrome_options=options) driver.get('https://www.momoshop.com.tw/search/searchShop.jsp?keyword=adidas') ps = driver.page_source ps = driver.page_source soup = BeautifulSoup(ps,'lxml') 接下來嘗試用 items = driver.find_elements_by_css_selector('.prdName') items = driver.find_elements_by_class_name('prdName') items = soup.findAll('p',{'class':'prdName'}) 怎麼抓都抓不到任何東西已經試了一整天也爬了很多文但都還是找不到原因Q 真的麻煩各位大大了QQ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.177.147 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1544277113.A.A10.html

→ TakiDog: 你有看過他網頁載入的順序嗎一定要selenium的話12/09 11:51

→ TakiDog: 寫一下time.sleep吧先把抓到的html導出，看好標籤再找12/09 11:51

→ TakiDog: requests 直接對這處理吧host../ajax/ajaxTool.jsp12/09 11:52

我加了停止時間五秒仍然抓不出來Q Taki大是指用requests.get去抓那個頁面的原始碼的意思嗎

推 v86861062: 為什麼前面兩行是proName? 應該是用prdName吧 :)12/09 12:47

已修正，真的非常感謝！ ※ 編輯: a6409tw (140.112.177.147), 12/09/2018 13:20:06 ※ 編輯: a6409tw (140.112.177.147), 12/09/2018 13:23:41

→ TakiDog: F12看一下 post過去就可以拿到資料了 12/09 18:16