推 ahsan: 咦,不算漢字,韓文本就是注音文,基本格局就是子音母音子音組 09/13 04:11
→ ahsan: 沒記錯的話,通通能發音,有意思的字不就幾千個嘛.ISO 應該有 09/13 04:12
→ ahsan: CJK 碼表可查.我玩 national languages 是 80 年代了,也許 09/13 04:14
→ ahsan: 又是給你舊情報. 09/13 04:14
我們設備內傳送簡訊都是 unicode,所以先查這份
https://zh.wikipedia.org/wiki/Unicode
https://zh.wikipedia.org/wiki/%E4%B8%AD%E6%97%A5%E9%9F%93%E7%B5%B1%E4%B8%80%E8%A1%A8%E6%84%8F%E6%96%87%E5%AD%97
http://tinyurl.com/lgmuws5
然後文內有提及查這份,中日韓越統一表意文字,這就你說的 CJK 了
情報是不舊,但是字集太大,文內說:
最初期的統一漢字共20,941字,其範圍為:0x4E00—0x9FCC
20941 > 4096
記憶體炸了~
所以要挑~~~
※ 編輯: HuangJC (60.251.197.63), 09/13/2014 04:45:07
→ HuangJC: CJKV 是含其它語系,我很快決定日越中文都不需要了 09/13 04:48
→ HuangJC: 所以現在字集縮小到 K0 這個來源.. 09/13 04:48
→ ahsan: 自己去算,這些是Hangul(韓文),但是你還會需要Jamo(字母). 09/14 04:15
這些是怎麼來的? 其實這題我已經解完,同事看過同意了
所以我不是要魚,我是要釣桿
如果你能解釋你的資料怎麼找到這的,看過比我的更有說服力,我會用你的
--------
承上次推文,我說縮小到 K0 這個來源
https://zh.wikipedia.org/wiki/KS_X_1001
這是 KS X 1001 的內容
KS X 1001是韓國用於書寫的諺文和漢字的字元編碼規格。
然後我看到諺文
https://zh.wikipedia.org/wiki/%E8%AB%BA%E6%96%87
再湊上某處看到,諺文就算是韓國的文字了(我是指,比注音高一級的)
這諺文範圍在哪呢?
U+AC00-U+D7A3, U+1100-U+11FF, U+3131-U+318E, U+FFA1-U+FFDC
以上,其中 AC00~D7A3, 就是你給的網址
如果我要用,我似乎少了一句話:上面的範圍,最前面就是最常用字
如果是最常用字了,那或許可以考慮
※ 編輯: HuangJC (175.180.190.39), 09/16/2014 02:27:12
→ HuangJC: 我做了個減法,光 AC00~D7A3就一萬多字,又爆了 09/16 02:28
→ HuangJC: 直接講完我的做法好了, KS X 1001 內有常用諺文 09/16 02:29
→ HuangJC: 所以我把這份文件和諺文取交集,就是常用諺文了 09/16 02:30
→ HuangJC: 接下來我還有好多語系要做,麻煩的是文件沒一致性 09/16 02:30
→ HuangJC: 每個國家都要重檢討一次,才能定義出常用字 09/16 02:30
→ HuangJC: 所以我覺得,我仍然沒拿到釣竿 09/16 02:31