作者peace9527 (謝謝你9527)
看板Python
標題[問題] Beautifulsoup的get_text()問題
時間Sat Jan 30 10:45:15 2016
昨天用BeautifulSoup(BS)的get_text()成功抓取網頁資料
但是問題出現了
我抓的網站是簡體字網站
但是用get_text()抓出來的是像這樣的資料:
b'/x56/x34/x49/x04'
我查看了一下他的資料型態是bytes
網頁的編碼是UTF-8 我電腦的預設編碼也是UTF-8
我想把這個資料轉成用原本的簡體字顯示 請問有辦法嗎?
感謝各位大神的幫忙!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.82.222.141
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1454121918.A.4E3.html
推 ocean5566: decode 01/30 17:47
→ peace9527: 不過他內容前面有個b 需要把他變成u再decode嗎? 01/30 21:42
→ ccwang002: b'...' 表示是 bytes,就直接 decode 不用什麼 u 01/31 02:12