作者processior (korman)
看板Python
標題[問題] 關於pandas讀取csv檔問題?
時間Wed Nov 23 13:57:24 2016
data = pd.DataFrame(pd.read_csv('h:\\test\\test.csv',header=0))
錯誤顯示為:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb6 in position 0:
invalid start byte
原始csv檔內容
買賣 數量 貨品
10 1 TV
我發現如果CSV檔內容如果有中文就會報錯,應該是編碼問題
不知道有沒有跟我遇到一樣的問題
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.8.48.200
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1479880647.A.47D.html
→ XJTRX: 我自己的非標準解法,用記事本打開CSV另存新檔編碼改UTF 11/23 16:10
→ XJTRX: 有試過其他方法,但是資料存放讀取一兩次以後編碼還是會有 11/23 16:11
→ XJTRX: 問題... 所以才出此下策... 同求高手解法 11/23 16:11
→ s860134: 你看一下你開存檔的模組有沒有能輸入編碼的參數 11/24 08:38
→ s860134: "資料存放讀取一兩次" 代表你讀寫過程中又寫入非 unicode 11/24 08:39
推 XJTRX: 謝s大指教~ 我再去檢查一下哪段搞砸了~ 11/24 15:58
推 BUQ: 補上 encoding="ISO-8859-1" 01/03 12:47
推 BUQ: 更正 是這個才對encoding = "big5" 01/03 13:29