看板 Python 關於我們 聯絡資訊
我在解析網頁時遇到某個欄位tag的層數不固定 可能的例子: 1.<div>範例</div> 2.<div><div>範例</div></div> 3.<div><div><p>範例</p></div></div> 想請問一下我要如何處理以上三種狀況,才能正確取出範例這兩個字? 只能用regular expression嗎? 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.163.118.235
jokester:可以po一下代碼嗎? 我用BeautifulSoup.getText()就拿到 03/10 12:09
感謝你,我都是用像div.string這樣的程式碼 只能拿到一層的字串,遇到多層就不行了 ※ 編輯: kanako 來自: 118.163.118.235 (03/10 13:18)
qwertmn:In [1]: from bs4 import BeautifulSoup 03/11 01:45
qwertmn:In [2]: body = BeautifulSoup('<div><div><p>範例</p></d 03/11 01:45
qwertmn:In [3]: body.text 03/11 01:45
qwertmn:這樣抓不到媽? 03/11 01:46