看板 Python 關於我們 聯絡資訊
問題解決,單純只是class的位置搞混了 如題,想做爬蟲抓圖 用的網站是這個https://unsplash.com/ 這是正確的class位置:https://imgur.com/Ri0YcfK 我從這篇開始改的:https://reurl.cc/OVEXz9 另外他這篇的程式碼改成現在用的語法可以運作後不知道為甚麼只能存一張圖片 (大概是我太不熟這類爬蟲工具了......) 我的程式碼如下: from selenium import webdriver from selenium.webdriver.chrome.service import Service from selenium.webdriver.common.by import By from selenium.webdriver.chrome.options import Options import os import time import numpy as np options = Options() folder_path = os.getcwd() driver_path = folder_path + "\chromedriver_win32\chromedriver.exe" options.chrome_executable_path = driver_path driver = webdriver.Chrome(options=options) driver.maximize_window() img_url_dic = {} driver.get("https://unsplash.com/s/photos/burger") # print(driver.page_source) position = 0 picture_number = 0 for i in range(10): position += i*500 + np.random.randint(100) js = "document.documentElement.scrollTop=%d" % position driver.execute_script(js) time.sleep(np.random.random()) tags = driver.find_elements(By.XPATH,"//img[contains(@class,'tB6UZ a5VGX')]") src = [] for tag in tags: src.append(tag.get_attribute('src')) # print(src) for i,element in enumerate(src): print(i,element) src_len = len(src) print(f'{src_len=}') driver.close() -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.138.74.61 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1678077784.A.DE0.html
fragmentwing: 啊 靠腰 我知道哪裡錯了 class是在src後面那個才是 03/06 13:00
fragmentwing: 不過這篇先留著 不知道哪裡還有錯 正在吃飯 等會回 03/06 13:00
fragmentwing: 去修正 03/06 13:00
fragmentwing: 改到目前可以了,雖然還是被反爬蟲擋掉 03/06 14:52
fragmentwing: 我把標題和內文修改一下 03/06 14:53
※ 編輯: fragmentwing (223.138.74.61 臺灣), 03/06/2023 15:00:38