看板 HANGUKMAL 關於我們 聯絡資訊
wagor:任加一個符號拼出來的結果都不在unicode那二萬字內,看來也是08/16 01:18
wagor:得買area hangul.沒聽過諺文派對直接搬韓國字來有何意見,因 08/16 01:19
wagor:為多年來看起來也沈寂的樣子.附帶一提,中世的那些子音結合具08/16 01:20
wagor:體是什麼沒人知道,也有很強的意見認為只是濃音不是複聲母,還08/16 01:21
wagor:有漢語上古複聲母派的把韓文那些中世子母當成一個佐證,證明 08/16 01:22
wagor:東亞也有複聲母語言. 08/16 01:24
確實中世的那些字母組合出來的字並不排在 Unicode 那二萬字裡面 而且韓文以音節編碼的方式老實說還蠻蠢的 當年會這樣做是因為當時電腦運算能力有限,複雜文字組合繪製實作上有困難所致 如果把中世的字母都加進來編碼,那麼所需的排列組合總字數將高達 48 萬 7 千字 整個 Unicode 編碼空間將完全被韓文塞爆且還不夠用,可想而知這種方法實在有問題 Area Hangul 的作法是所謂的「漢陽 PUA」,PUA 指的是使用者造字區 是在 Unicode 所定義的閒置空間內,將古韓文、口訣等字自行編碼加入 它的編碼方式仍然是傳統的音節單位編碼,總共編了 5,299 個字 從數量上可知並不是所有可能的音節組合都編進去 而是從現存的諺文古文獻中選出真正有出現過的才編入 基本上要顯示漢陽 PUA 的文件並不難,只要有對應的字形就可以了 以下網址第一張圖是我在 Linux 下的 gedit 文書編輯器中所開啟漢陽 PUA 編碼的文件 http://hangukmal.albyu.co.cc/yethangul_gedit 注意這個 gedit 只是一般陽春的編輯器,並不是 Area Hangul 韓文專用的編輯器 ( Haansoft 有出 Linux 平台的版本,但我沒錢買 XD ) 但是只要使用支援漢陽 PUA 的字型,如 New Batang 等,就能顯示古韓文 但是輸入是個大問題,在 Windows 下可以找到一些合用的古韓文入力器 在 Linux 下我還沒找到適當的輸入法,不過我已經有些初步的方式可以處理 漢陽 PUA 的缺點在於,若是使用者沒有適當的字型,那古韓文的部分將是一堆亂碼 另一種解決方法則是從 Unicode 編碼方式根本著手,讓韓文改以字母為單位來編碼 Unicode 本身就支援組合字的方式來編碼,許多書寫結構複雜的文字 例如阿拉伯文、印度天城體等文字,都需要字母結合連寫時額外的字型繪製處理 這些文字在 Unicode 裡面的編碼是依照字母分開單獨各自編碼 而電腦的作業系統在顯示這類的文字時,必須有額外的字型繪製引擎來把它們畫在一起 Windows 的字型繪製引擎為 Uniscribe,而 Linux 的字型繪製引擎則是 Pango 所以,韓文也可以透過這樣的機制,把字母分開編碼,然後再利用字型繪製引擎 把韓文初聲、中聲、終聲字母畫在同一個 block 裡面,就能顯示正常的韓文字了 理論上這樣的方式僅需約 100 個字母碼位,就能表示所有的韓文音節組合 Unicode 針對這樣的方式,特別有一個「Hangul 字母領域」的區域來表示這類韓文字母 Hangul 字母領域共有 255 個碼位,足夠表示中世諺文字母和傍點 這樣的處理機制,在 Linux 和 Windows 上都已經支援了 只要安裝支援這樣字型繪製機制的 UnBatang 字型就能夠達到這樣的效果 請看以下同樣網址的第二張圖,就是在 Linux 下用 gedit 編輯器顯示組合式古韓文 http://hangukmal.albyu.co.cc/yethangul_gedit 這就是利用 Linux 的 Pango 字型繪製引擎,把韓文字母畫在同一個 block 的效果 可以看到畫出來的結果並不是很好,初聲字母位置很多都偏到一邊去 而且字母長度與大小不會隨著初聲、中聲、終聲的位置改變,造成有些字長有些字短 但這個是字型繪製引擎對於韓文繪製的處理不甚完善所致 只要日後改善這個字型繪製引擎,就能達到和第一張漢陽 PUA 那樣漂亮的效果了 在輸入法的部分,Linux 上的 SCIM 之 scim-hangul 輸入法模組已經支援組合字的輸入 Windows 平台上也有對應的輸入法可用,這種方式可預見將是未來古韓文處理的標準 韓國政府的 21 世紀世宗計畫,也是利用這樣的編碼方法,把古諺文文獻進行電子化 利用上述的二個方式,不需要 Area Hangul,一樣能夠顯示出中世的諺文字體 台語諺文字,利用 Unicode 組合字的方式,將可以自由組合出符合台語音韻的音節 我想這是台語諺文派未來可以努力的方向,現今的電腦技術已經可以支援這類的應用了 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.166.72.35
shouhei:好有趣的技術 08/18 01:17
saram:韓文萬能. 請觀賞第二段韓語唱中文歌時的注音文. 08/19 07:05