作者royt (lulu)
看板Python
標題[問題] 中文編碼
時間Tue May 16 15:22:16 2017
我用爬蟲想抓網頁上的中文資料
網頁上標明邊碼方式charset=Big5
我試著在輸入parser的文字內容加上
decode('big5'),但都有一些文字輸出是亂碼
請問有什麼辦法嗎?
-----
Sent from JPTT on my Samsung GT-I9300.
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.83.15.100
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1494919342.A.C23.html
→ wennie0433: 試試encode('latin1','ignore').decode('utf-8') 05/17 01:28
→ coeric: 我遇過,有些只是自身電腦問題....不是很懂為何... 05/18 14:35
→ coeric: 寫到檔案或資料夾都正常的 只是顯示有問題 05/18 14:35