看板 Python 關於我們 聯絡資訊
url = 'http://www.58b.tv/vod-play-id-87084-sid-0-pid-1.html' html = urllib.request.Request(url,headers = headers) req = urllib.request.urlopen(html).read().decode('utf-8') soup = BeautifulSoup(req,features = 'lxml') 這是我餵給beautifulsoup的程式碼 我要抓取的內容是那個網頁裡面的"xfplay://dna.xxxxxxxx"也就是"先鋒傳送門"那裏的連結 但我發現beautifulsoup怎麼樣也抓不到 於是我直接print(soup)來看 發現沒有那個"xfplay://" 怎麼會這樣@@ 該怎麼辦 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.24.117.198 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1531282149.A.C70.html
Kazimir: 那個網址看起來是js組出來的 我覺得你要是不想動腦筋 07/11 17:18
Kazimir: 就用web-driver跑一遍自然有 不然的話你看response 293行 07/11 17:19
Kazimir: 那段應該是給js的資料 我猜應該可以用這個拼出下一層 07/11 17:22
Kazimir: 然後再從第二個檔案拿撥放器的url 07/11 17:23
我目前是有在該網頁的右鍵-檢查-network中發現某一個"name"裡面包含我要的網址, 我該怎麼取得那裏的資料呢 ※ 編輯: ponwar87123 (36.227.137.209), 07/11/2018 19:47:39
TakiDog: .name .herf 可以直接取值 沒記錯的話 07/12 02:47
TakiDog: 等等name 在network 他是個封包吧,看你瀏覽器喂給他什 07/12 02:48
TakiDog: 麼去處理 07/12 02:48
ponwar87123: 那我應該怎麼取得那個封包呢 07/13 01:33
TakiDog: 看你那個封包怎麼傳帶了什麼資訊,用Python仿造出來,依 07/13 19:26
TakiDog: 照你的說法你要的網址就在回應中 07/13 19:26