看板 Python 關於我們 聯絡資訊
我是用beautiful soup 來抓連結,print是沒問題,但 為什麼 write 是會出現 編碼錯 誤問題,請問如何處理? http://i.imgur.com/GRkRZ9T.jpg http://i.imgur.com/Yjfi7Hl.jpg -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 163.22.18.105 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1487233729.A.D57.html
lance8537: 話說不用import csv嗎 02/16 18:01
lance8537: encode看看 02/16 18:02
lenofire: Encode 又出現另一bug 02/16 18:07
lenofire: Txt也試過,也有同樣問題 02/16 18:08
kilfu0701: link.get('href').encode('ascii', 'ignore') 02/16 18:31
kilfu0701: 因為網頁的link裡 某一個後面摻了奇怪的字元 02/16 18:33
kilfu0701: 可以試試 print repr(link.get('href')) 印出來看 02/16 18:35
lenofire: 我print成功再print有什麼用 02/16 19:29
s860134: 用codecs開檔寫即可 02/16 19:44
lenofire: 什麼叫codec?? 02/16 21:24
eight0: codecs 是一個用來處理編碼的 module 02/16 22:05
eight0: https://is.gd/s8VeCV 02/16 22:05
eight0: py3 的 open 函數可以指定編碼,py2 要用 codecs.open 或 02/16 22:06
eight0: io.open 02/16 22:06
lenofire: 感謝,已解決,順道問大家用python都是在ubuntu作業系 02/17 08:13
lenofire: 統環境下? 02/17 08:13
Neisseria: 是用 Linux,但不一定是 Ubuntu,小弟用 Debian 02/17 09:16
lance8537: 我輸出看看發現你抓的資料最後一個是NoneType耶 02/17 13:28