推 liton: 我記得sas默認中文的encoding是GBK 03/15 22:04
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 120.126.194.162
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1552570428.A.28B.html
大家好,想用python讀SAS檔但會出現錯誤
1.
mydata_sas = pd.read_sas('aacompany98_106.sas7bdat',encoding='utf8')
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb2 in position 44:
invalid start byte
2.
mydata_sas = pd.read_sas('aacompany98_106.sas7bdat',encoding='big5')
UnicodeDecodeError: 'big5' codec can't decode byte 0x9c in position 2:
illegal multibyte sequence
3.mydata_sas = pd.read_sas('aacompany98_106.sas7bdat')
這個可以讀出來,但中文字完全空白,猜測是編碼問題,但沒道理utf8
跟big5都不能阿~~~
請大家指點,謝謝
--