看板 Python 關於我們 聯絡資訊
感謝大家的回應~在下沒有明確的指出問題爬蟲問題,是因為我想爬的網頁是付費網頁 (我是付費會員),有點怕被吉,所以用馬賽克馬了一部份,不好意思~ 以下是在下的步驟 1. 登入"登入"頁面>>>https://imgur.com/a/oHQIY 2. 在網頁的上半部點選其中一個選項>>>https://imgur.com/a/p9Nj9 3. 在網頁的下半部會重新載入資料,同樣點選其中一個選項>>>https://imgur.com/a/CFQFO 4. 進入頁面>>>碰到有"點擊下載的連結時"就不會有問題(selenium),不然就會卡住~ >>>https://imgur.com/a/GHQ7C 4-1. 檢查元素,檢查不到影片網址>>>https://imgur.com/a/pmZKx 4-2. 在network裡面看不到檔案類型為media的file>>>https://imgur.com/a/qP6FV 4-1與4-2就是我所碰到的問題的總結 謝謝各位 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 120.110.127.195 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1514989620.A.E09.html
f496328mm: 這圖也太小了....... 01/03 22:53
ckc1ark: m4s就是了吧 content type是video/mp4或audio/mp4 01/03 23:40
vi000246: 這個網站我爬過 請去我的github挖寶吧 01/04 00:11
vi000246: 提示:vimeo 01/04 00:16
Kazimir: 要不然就是先找到影片seg網址的list是什麼時候送過來的 01/04 00:17
Kazimir: 否則就是看看能不能直接對seg的網址丟request 01/04 00:18
jamesxxx1997: 謝謝v大~真的太讚啦! 01/04 21:33
jamesxxx1997: 不過從code看起來,我還有很多要學XD 01/04 21:33
jamesxxx1997: K大~請問甚麼是seg? 01/04 21:34
Kazimir: 在撥放器已經執行的時候不是有segment-1.m4s嗎 01/05 01:13
Kazimir: 我之前爬過一個串流是用m3u8裝所有segment的網址先傳過來 01/05 01:14
Kazimir: 然後撥放器再按照順序去下載這些分割 所以一種方式就是 01/05 01:15
Kazimir: 先去找到那個list在哪 解析以後就有所有的網址了 01/05 01:15
Kazimir: 另一種假設他的segment完全沒加密網址有規律 乾脆直接改 01/05 01:17
Kazimir: 網址就好 01/05 01:17