作者airizumo ( 歐巴馬)
看板java
標題[問題] 編碼問題
時間Thu Feb 7 00:04:18 2013
想請問各位先進
我有一個檔案(utf-8)用ultra打開看到的是
FF FE 54 00 4F 00 4F 00 4C 00 .... => TOOL...
但用byte[]讀取檔案字串時
byte[] content
for(int i=0;i<content.length;i++){
s2 = s2 + String.valueOf(Integer.toHexString(b[i]))+ " ";
}
最後的讀出來的卻是
ffffffef ffffffbb ffffffbf 54 4f 4f 4c ....
想請問一樣是show出每一個byte結果卻會有一段落差??
另外想請問若我用byte[] 讀取ANSI檔案後有辦法將裡面的byte轉成相對應的utf-8編碼嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 123.195.56.30
→ coolcomm:這是UTF-16吧? 02/07 00:47
→ coolcomm:ASCII不是UTF-8的子集合嗎= = 02/07 00:51
→ coolcomm:0xFEFF是BOM Java內建的API好像不會識別BOM 02/07 01:11
推 coolcomm:囧...樓下是對的 02/07 01:16
→ tkcn:樓上你跟 #13719 的 bleed1979 是串通好的吧... XD 02/07 01:19
→ tkcn:說錯了,是 #13723 02/07 01:20