作者guanj (gaunj)
看板Python
標題[問題] 如何爬blob圖檔
時間Sat Dec 12 22:39:59 2020
如題
因為網頁是有跟js互動的
所以我想要用selenium爬上面的圖片
圖片部分的原始碼長這樣
<img border="0" class="hej-view__content"
src="blob:
https://xxxxxxxxxxxxxx/10c7d445-5263-4bcf-b999-7e1e1a669d45">
有一些直接貼 blob:
https://XXXXXXXXX/XXXXXXXX 這串網址可以找的到圖
這類的有辦法爬下來
另一些貼網址去找只會顯示 "檔案可能已遭到移動、編輯或刪除。"
這個就不知道要怎麼爬
不知道blob的運作原理,為什麼可以讓有些圖片可以爬 有些不行
有沒有大大可以指引一下方向
謝謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.195.45.102 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1607784002.A.5E1.html
推 TakiDog: 可以用js 撈Object,看是寫js request送回自己的server 12/13 03:16
→ TakiDog: 或是轉base64再用python解,或是樓下提供更好的方法XD 12/13 03:16
→ TakiDog: blob可以查 File API / Blob urls 12/13 03:20