作者mu1007 (小橘)
看板Linux
標題[問題] iconv轉編碼後遇到的問題
時間Thu Jul 13 07:58:46 2017
各位前輩好,我是linux的門外漢><
因緣際會之下碰到linux這個神奇的系統
有一個不太明白的問題想向大家請教~
麻煩各位m(_ _)m
由於需要把一個有四千多萬筆資料的csv檔他的編碼從utf8轉成big5
後來發現linux底下有個叫做iconv的指令可以輕輕鬆鬆轉!!!
透過指令轉換並產生新的檔案之後
我用"file -i 檔名"觀看
發現轉出後的檔案出現"Charest=iso-8859-1
為什麼不是big5 QAQ?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.134.239.145
※ 文章網址: https://www.ptt.cc/bbs/Linux/M.1499903928.A.04C.html
推 SeamusBerloz: 大五碼要儲存時的第一 byte (0xA0-0xFE) ,正好用 i 07/13 09:04
→ SeamusBerloz: so8859-1 是可以涵蓋的,換句話說,用 iso8859-1 只 07/13 09:04
→ SeamusBerloz: 是儲存的一種手段,而不是真正用了這個來編碼。 07/13 09:04
推 SeamusBerloz: 大五碼本來就是用了ascii沒使用的部分來編成的。 07/13 09:08
推 SeamusBerloz: 一個中文用了兩個iso8858-1,所以只要儲存排列不要 07/13 09:15
→ SeamusBerloz: 錯位,讀取者可以直接當作大五碼來看懂。 07/13 09:15
→ mu1007: 了解了!謝謝!!! 07/13 12:57