[問題] beautifulsoup爬蟲問題

作者snakei14702 (sun抓奶廷已經gg了怎麼뼺)

看板Python

標題[問題] beautifulsoup爬蟲問題

時間Fri Jan 3 05:51:32 2020

小弟寫了一段程式碼爬蟲不過很怪這個網站有部分爬得出來 (https://histock.tw/stock/mainprofit.aspx?no=00632R&from=20181102&to=20181102) 有部分爬不出來像是我要找這個網站的'table' https://i.imgur.com/eqSE67i.jpg 寫了以下程式碼確找不到： import requests from bs4 import BeautifulSoup source = requests.get('https://histock.tw/stock/mainprofit.aspx?no=00632R&from =20181102&to=20181102', verify= False)ꀊ soup = BeautifulSoup(source.text, ["lxml-xml"]) table = soup.find('table') print(table) 可是有的tag找的到我去讀soup用肉眼搜尋裡面還真的沒有table這個tag 不知道是我用的方法不對還是怎樣麻煩版上強者幫忙解惑了謝謝！！ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.84.179 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1578001896.A.141.html

推 TuCH: 應該是動態網頁 01/03 10:04

推 penut85420: .aspx網頁應該是動態生成網頁內容 01/03 12:43

→ penut85420: 可以試試看用selenium套件去爬內容再套bs4 01/03 12:43

→ snakei14702: 謝謝兩位我晚上試試感謝 01/03 15:21

推 f496328mm: bs4 會有讀不到的問題，我之前也用bs4 01/04 23:32

→ f496328mm: 後來改用 lxml 01/04 23:33

→ TakiDog: lxml速度快的多，用selenium下下下策，看一下封包用requ 01/05 02:53

→ TakiDog: ests吧 01/05 02:53

推 poototo: selenium把瀏覽器視窗及載圖關掉 01/05 08:21