作者skyivan (官人)
看板Python
標題[問題] 爬蟲遇到一樣的class如何篩選
時間Thu Aug 31 16:31:03 2017
各位好,我看書試著依樣畫葫蘆抓台彩首頁的開獎號碼
抓威力彩可以,但想抓大樂透時遇到問題
仔細一看發現有好幾種商品的class都是contents_box02,用find只能得到第一個
只抓得到威力彩
用find_all可以同時找到好幾個商品
但不知道如何只抓第三個class為contents_box02的div
想請教如何處理,程式碼如下
import requests
from bs4 import BeautifulSoup
url="
http://www.taiwanlottery.com.tw"
html=requests.get(url)
sp=BeautifulSoup(html.text, 'html.parser') #解析原始碼
data1=sp.find_all('div',{'class':'contents_box02'})
print(data1)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.51.219.89
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1504168267.A.3F5.html
推 blue14753: print(data1[2]) ? 08/31 16:41
→ wennie0433: 換個html5lib or lxml 解析看看 08/31 22:14
推 coeric: print(data1[2]) 即可 09/01 11:02
→ skyivan: 原來這麼簡單...問題解決了,感謝樓上幾位的回答 09/01 11:22