[問題] 用BeautifulSoup解析的網頁碼與原本不同

作者ponwar87123 (干我屁事喔北七)

看板Python

標題[問題] 用BeautifulSoup解析的網頁碼與原本不同

時間Wed Jul 11 12:09:06 2018

url = 'http://www.58b.tv/vod-play-id-87084-sid-0-pid-1.html' html = urllib.request.Request(url,headers = headers) req = urllib.request.urlopen(html).read().decode('utf-8') soup = BeautifulSoup(req,features = 'lxml') 這是我餵給beautifulsoup的程式碼我要抓取的內容是那個網頁裡面的"xfplay://dna.xxxxxxxx"也就是"先鋒傳送門"那裏的連結但我發現beautifulsoup怎麼樣也抓不到於是我直接print(soup)來看發現沒有那個"xfplay://" 怎麼會這樣@@ 該怎麼辦 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.24.117.198 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1531282149.A.C70.html

推 Kazimir: 那個網址看起來是js組出來的我覺得你要是不想動腦筋 07/11 17:18

→ Kazimir: 就用web-driver跑一遍自然有不然的話你看response 293行 07/11 17:19

→ Kazimir: 那段應該是給js的資料我猜應該可以用這個拼出下一層 07/11 17:22

→ Kazimir: 然後再從第二個檔案拿撥放器的url 07/11 17:23

我目前是有在該網頁的右鍵-檢查-network中發現某一個"name"裡面包含我要的網址，我該怎麼取得那裏的資料呢 ※ 編輯: ponwar87123 (36.227.137.209), 07/11/2018 19:47:39

→ TakiDog: .name .herf 可以直接取值沒記錯的話 07/12 02:47

→ TakiDog: 等等name 在network 他是個封包吧，看你瀏覽器喂給他什 07/12 02:48

→ TakiDog: 麼去處理 07/12 02:48

→ ponwar87123: 那我應該怎麼取得那個封包呢 07/13 01:33

→ TakiDog: 看你那個封包怎麼傳帶了什麼資訊，用Python仿造出來，依 07/13 19:26

→ TakiDog: 照你的說法你要的網址就在回應中 07/13 19:26