[問題] InputStreamReader的read()

作者OoShiunoO (機機勳)

看板java

標題[問題] InputStreamReader的read()

時間Sun Feb 8 18:10:41 2015

最近在看歐萊裡的JAVA網路程式設計裡面有講到這段code: InputStreamReader r = new InputStreamReader(in, "MacCyrillic"); StringBuilder sb = new StringBuilder(); int c; while((c=r.read()) != -1) sb.append((char) c); return sb.toString(); 他是讀取某個輸入串流in,並以MacCyrillic編碼轉換為unicode字串輸出。其中read()會回傳0~65535的int，這代表Unicode字元，我的問題是為什麼只會回傳0~65535而已?Unicode編碼不是有好幾百萬個嗎? 另外，(char)這個強制轉型是把int轉成char，它的轉換標準是依據什麼呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.193.37.2 ※ 文章網址: https://www.ptt.cc/bbs/java/M.1423390244.A.22E.html

推 mozzan: Unicode就是可以表達所有的字,2 bytes的確就足夠 02/08 20:01

→ mozzan: 你說得幾百萬指的是UTF-8嗎？UTF-8用4 bytes是因為要彌補 02/08 20:02

→ mozzan: unicode在顯示ascii code也是用2 bytes的缺陷,他是可變長 02/08 20:03

→ mozzan: 度,不代表他真的使用到2的32次方的字元 02/08 20:04