作者Mutibil (nujabes)
看板Python
標題[問題] 用beautiful find_all沒找齊對應資料
時間Fri Nov 17 14:19:54 2017
使用python 3.5版本
最近想摸一下beautifulsoup的功能
所以想爬broadway的網站,寫個簡易查詢時刻表等功能
問題是這樣的
先附上code
url= '
https://www.nyc.com/broadway_tickets/'
html = urllib.request.urlopen(url).read()
soup BeautifulSoup(html, 'html.parser')
dramaName = soup.find_all('h2')
dramaList = []
for i in dramaName:
Print(i.string)
dramList.append(i.string)
劇名是放在h2 底下,但我用find_all去找body底下的h2標籤
只能找出局部的資訊,沒辦法找出所有的劇名
爬了一下stackflow, 有看到有些網站支援問題
有嚐試把html.parser換成lxml,但問題還是存在
想請問有可能朝哪個方向去解決這問題呢?
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 173.56.84.230
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1510899599.A.4E3.html
推 ckc1ark: 用developer panel可以看得出來他有query 11/17 14:31
→ ckc1ark: www.nyc.com/broadway_ticketselements/?page=2 ~page=12 11/17 14:31
→ Mutibil: 我是用developer tool看 想說看起來都在同一頁底下 11/17 14:51
→ Mutibil: 但剛剛看了一下page source 好像真的就那些資訊 11/17 14:52
→ Mutibil: 謝謝你 我再試試看 11/17 14:52