作者jamesxxx1997 (黃~)
看板Python
標題[心得] 終於把蔡XX網站的影片爬下來了~心得分享~
時間Sun Jan 28 16:12:44 2018
大家好,這是我之前下載影片時碰到的困境
https://goo.gl/rs7tQG
發現解法了!!!
其實完全不用管segment,其實網站把影片url藏在iframe的javascript中
那我是怎麼找到的呢?
直接在chrome dev tools的element中ctrl+F,打上.mp4!!!
https://imgur.com/a/eizXW
以下是我的程式碼(別忘了driver.switch_to.frame(0)來抓iframe中的javascript原始碼)
https://pastebin.com/BwWZ71m4
謝謝!!!
PS1.看完大數學堂了,不過針對scrapy有些比較難的部分(ex.downloader middleware)
只有找到幾支免費的教學影片,還有人推薦嗎?感謝!
PS2.有人有其他進階的爬蟲下載教學,也歡迎分享!!!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.82.26.105
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1517127167.A.88D.html
→ vi000246: scrapy直接看官方文件 或是買書吧 01/28 21:40
→ jamesxxx1997: 官方文件有時候看不太懂ㄝ 01/28 23:40
→ jamesxxx1997: 影片比較容易吸收~ 01/28 23:41
推 modelfucker: 那如果影片的src是沒有副檔名的呢? 02/02 20:42
→ modelfucker: 來源點進去都是直接access denied這種我搞好久還是 02/02 20:42
→ modelfucker: 都抓不下來 02/02 20:42