看板 Python 關於我們 聯絡資訊
各位好 在這裡想請問大家 Python裡有沒有什麼方法 可以讀ANSI編碼的CSV 我不想用convert的方式換成其他編碼方式 因為讀大檔案的時候會很拖時間 請各位大神指導 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.32.19.185 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1469505519.A.B22.html
kenduest: 用 iso8859-1 編碼打開? 07/26 12:57
kenduest: handle = codecs.open(filename,encoding='iso8859-1') 07/26 12:57
BlgAtlfans: 感謝解答 但是如果CSV檔案內有中文字要怎麼辦 07/26 14:00
BlgAtlfans: 用Big-5嗎 07/26 14:01
BlgAtlfans: 我指的中文是ANSI+中文字 07/26 14:03
kenduest: 你不是都說只管 ansi 了怎麼還有 big5 ? 07/26 14:05
kenduest: 若你說的中文,是說檔案內本身編碼為 big5 07/26 14:06
kenduest: 那你就指定編碼讀取就可以了,上面原本寫法改一下 07/26 14:06
BlgAtlfans: 應該說檔案是有中文字的ANSI編碼 07/26 14:07
BlgAtlfans: iso8859-1可以開但是中文會變亂碼 07/26 14:08
kenduest: 就上面說,用 big5 編碼開啟 07/26 14:11
BlgAtlfans: 試過了沒辦法開 07/26 14:13
kenduest: 具體描述一下什麼叫做沒辦法開?要討論至少得有個資訊 07/26 14:14
BlgAtlfans: 因為檔案本身是ANSI 但是裡面內容有中文字 07/26 14:14
kenduest: 程式碼辦法開的具體錯誤訊息?? 07/26 14:18
kenduest: (沒辦法開) 07/26 14:18
BlgAtlfans: https://imageshack.com/i/pnbeKzGxp 07/26 14:19
BlgAtlfans: https://imageshack.com/i/poR7bOq3p 07/26 14:21
kenduest: 你可能要獨立寫一段程式碼測這功能 07/26 16:58
kenduest: 要不然直接在大架構內 django 直接用是很難知道你的問題 07/26 16:58
alibuda174: 到底是什麼編碼? 07/26 17:58
s860134: 直接傳 data 上來,至少讓他人重現你的問題 07/26 19:34
s860134: 另外直接用 cp950 開會比big5好 07/26 19:46
alibuda174: 0x97...或許是Big5+UAO 07/26 20:06
AndCycle: 那用 big5hkscs 應付看看, 不然就要自己寫了 07/26 22:03
uranusjr: 「中文字的ANSI編碼」這個描述根本就自相矛盾... 07/26 23:35
BlgAtlfans: 感謝各位回答 data連結如下 07/27 15:43
BlgAtlfans: http://46.101.91.196/dataset/flight 07/27 15:44
BlgAtlfans: 黃色csv圖示便是 07/27 15:45
alibuda174: 用CP950可解吧 07/27 17:09
s860134: 你應該是讀錯檔案,你提供的資料不管cp950,big5 都能讀 07/27 22:04
s860134: http://imgur.com/a/oN9nq 07/27 22:07
BlgAtlfans: 好的我再試試 感謝解答 07/28 01:50