[問題] Beautifulsoup的get_text()問題

作者peace9527 (謝謝你9527)

看板Python

標題[問題] Beautifulsoup的get_text()問題

時間Sat Jan 30 10:45:15 2016

昨天用BeautifulSoup(BS)的get_text()成功抓取網頁資料但是問題出現了我抓的網站是簡體字網站但是用get_text()抓出來的是像這樣的資料： b'/x56/x34/x49/x04' 我查看了一下他的資料型態是bytes 網頁的編碼是UTF-8 我電腦的預設編碼也是UTF-8 我想把這個資料轉成用原本的簡體字顯示請問有辦法嗎？感謝各位大神的幫忙！ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.82.222.141 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1454121918.A.4E3.html

推 ocean5566: decode 01/30 17:47

→ peace9527: 不過他內容前面有個b 需要把他變成u再decode嗎？ 01/30 21:42

→ ccwang002: b'...' 表示是 bytes，就直接 decode 不用什麼 u 01/31 02:12