看板 Python 關於我們 聯絡資訊
各位板友好, 最近看youtube教學 練習用Python抓圖片、影片、分析網站 import requests res = requests.get(' http://www.maplestage.com/episode/139279/%E4%B8%80%E8%A2%8B%E5%A5%B3%E7%8E%8B+20160420+%E9%81%93%E9%AB%98%E4%B8%80%E5%B0%BA+%E9%AD%94%E9%AB%98%E4%B8%80%E4%B8%88+%E5%A4%AB%E5%A6%BB%E7%94%9F%E6%B4%BB%E8%AB%9C%E5%B0%8D%E8%AB%9C!/') print res.text 我是找maplestage練習抓上面的影片 像上面的影片是dailymotion的 可是在res.text裡面內容找不到相關的影片連結 小弟不太懂網頁裡面語言 所以試了很就可是還是無法成功 所以想知道是不是有方法找到影片的連結來下載 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.33.62 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1461233734.A.825.html
busystudent: 幾個問題希望你回答,你這網頁裡有許多影片,請問你要 04/21 18:21
busystudent: 抓哪支影片? 04/21 18:21
busystudent: 所以你目標是抓影片聯結還是下載影片? 04/21 18:24
DearYoyoDon: 希望能直接抓下影片,例如能下載某個節目某一集 04/21 18:35
aweimeow: 影片網址是這個嗎?http://goo.gl/okaoP4 04/21 20:10
aweimeow: ptt站方不給貼 ppt.cc 只好貼 goo.gl 的 orz 04/21 20:10
DearYoyoDon: 存取遭到拒絕耶@@?! 04/21 20:10
aweimeow: http://pastebin.com/7yqGJCWv 我把影片網址貼這 04/21 20:12
aweimeow: 呃,我知道原因了 04/21 20:14
aweimeow: 我換了個 IP 再去存取這個網址是 403 04/21 20:14
aweimeow: 他那個網址是只能讓我的 IP 存取,所以你才會 forbidden 04/21 20:14
aweimeow: 總之,他把影片網址藏在這段 http://imgur.com/xyET58S 04/21 20:16
aweimeow: 你找看看囉,找的到影片網址下載就容易了 04/21 20:17
DearYoyoDon: 那用什麼解析這些網址,這是能轉換的嗎? 04/21 20:37
DearYoyoDon: 你圖片裡上面那一行的網址裡面的HTML就可以只接找到 04/21 20:40
DearYoyoDon: mp4的連結 04/21 20:40
aweimeow: 可以試試 lxml 然後用 xpath 來找到你要的東西 04/21 20:45
aweimeow: BeautifulSoup 好像也可以,但是我沒有用過 04/21 20:46
DearYoyoDon: 非常感謝,我一開始試soup但是總覺得好像轉換後有些 04/21 20:55
DearYoyoDon: 找不到,不過我現在是先從網站裡面找到.../embed/.. 04/21 20:56
DearYoyoDon: 的影片連結,再從新的網站去找下載連結 04/21 20:56
DearYoyoDon: 有點麻煩,但是先這樣做,希望版友能指點 :) 04/21 20:57