看板 Key_Mou_Pad 關於我們 聯絡資訊
我覺得PieTTY是個不錯的解決方案,怎麼說呢? 對於不了解Unicode補完計畫的人,我想說太多其實沒有必要, 像我家的狀況就是有人問我"他的意思是Unicode不好嘍?".....Orz "他給的東西是另外一個補完計畫?" 畢竟大家有大家的選擇,我只大略說一下目前的問題的癥結點, 不是工程師,看不懂前面討論串的人,你可以看看這篇,大概了解一下。 (我把重點放在日文跟Windows,其他字跟系統我就說聲抱歉了) Big5 & JIS/EUC: 首先大家必須先了解,我們看到的日文有兩種, 一種是Big5的外字集日文,這是在當年中文環境為了要打日文而創出來的, 不過因為他是"外字集",所以原本的Big5字集中沒有這些字, 一種是日本方面使用的JIS/EUC等的日文內碼字集,這是日本當地使用的標準字集, 就跟台灣早期使用Big5字集作為標準字集一樣。 而Unicode是一個統一字集,裡面包括了Big5字集跟JIS/EUC字集以及各種語言字集, 在Unicode的環境下(WindowsXP/Windows2000等),不論是Big5字集或是 JIS/EUC字集都會被系統轉成Unicode字集,所以不論是那種字集都沒有顯示問題, 只有Big5外字集因為不在Big5標準字集裡,無法被Unicode系統正確的轉換, 所以看不到。 這樣一來,原有的狀況如下: Win98/Win95(ANSI 系統) 網頁日文 -- 無法觀看,需安裝瀏覽器的日文JIS/EUC支援及日文字形才可觀看 Big5外字集日文 -- 無法觀看,需安裝外字集才可觀看(例如中國海) WinXP/Win2000(Unicode 系統) 網頁日文 -- 可觀看,將瀏覽器編碼設定為日文即可(字型Unicode已經內建) Big5外字集日文 -- 無法觀看,需安裝外字集才可觀看(例如中國海) 所以早期對日文顯示的處理方式裡面,就已經有各自的解決方案,只是到了Unicode 底下,網頁部份已經被Unicode解決,所以不用處理了,只要處理外字集部份。 Unicode補完計畫: Unicode補完計畫就是為了解決"外字集"這個部份而開發的, 早期沒有使用Unicode時,為了在當時的標準環境(Big5字集)底下打出日文, 所以使用了"Big5外字集",這個外字集使用了Big5編碼,並增加了一些標準Big5 中沒有的字,例如日文、韓文、異體字、部首、筆劃、碁銹恒裏墻粧嫺、 還有例如[吉吉]等字以及符號。 其中,Unicode有收編"碁銹恒裏墻粧嫺"跟符號,(因為這幾個是MS收編的CodePage950) 其他的字,都沒有收錄,而日文跟韓文的部份,收錄的是日文當地字集跟 韓國當地字集,不是Big5外字集中日文的字集,所以,在Unicode底下, 你是看不到外字集的日文字跟韓文字。 Unicode補完計畫安裝之後,會把外字集的日文"對應到"Unicode底下日本字集的日文, 讓你看到"Big5外字集日文"時,直接顯示"日本字集日文", 用以解決外字集日文顯示的問題。 打字問題: 這個問題其實就是Unicode補完計畫出現問題的地方,上面提出來的狀況都是"看" 而沒有"寫",看日文的狀況可以處理,那寫日文的狀況呢? 這個狀況其實複雜的多,為了避免大家混淆,我直接講結果....... (其實是打了兩頁還畫圖之後覺得太麻煩了,全部刪掉....) (想知道背後原理的人請去參加版聚...XD) 下面的結果你搭配這兩張圖看一下大概就知道意思了, 借用一下Unicode補完計畫網頁的圖。 沒裝UAO(Unicode補完計畫) http://static.flickr.com/19/103666262_d4373e65fe_o.jpg
有裝UAO http://static.flickr.com/31/103666285_ee74ff8e9d_o.jpg
一開始的結果如下~~ 沒裝UAO打日文(圖一A) --> 沒裝UAO的Unicode環境使用者(圖一A) --> 看的到 沒裝UAO打日文(圖一A) --> 裝UAO的Unicode環境使用者(圖二A) ----> 看的到 沒裝UAO打日文(圖一A) --> 裝外字集的ANSI環境使用者(圖一B) ----> 看不到 裝了UAO之後~ 裝UAO打日文(圖二A-->圖二B) --> 沒裝UAO的Unicode環境使用者(圖一A) --> 看不到 裝UAO打日文(圖二A-->圖二B) --> 裝UAO的Unicode環境使用者(圖二A) ---> 看的到 裝UAO打日文(圖二A-->圖二B) --> 裝外字集的ANSI環境使用者(圖二B) ---> 看的到 我想結果應該很明顯了,有裝沒裝剛好結果顛倒,裝了之後,為了照顧B區的使用者 所以,A區的日文會轉成B區存檔,但是這樣的結果,會讓沒裝的人因為沒有A-B之間 日文的對應而看不到~ 你的正義 v.s. 我的正義: 所以誰對誰錯?我覺得沒有對錯,只是立場不同罷了.... 像Leland網友因為使用FreeBSD,所以他沒有UAO可以安裝,而且UAO會造成許多 本來他可以觀看的文件因此出現缺字,所以他反對使用UAO,而對有裝UAO的人來說, UAO讓他們可以瀏覽ANSI環境底下的日文,所以他們安裝UAO,這樣算是立場的對立吧? 現在的狀況底下,原本沒裝UAO的網友只看不到使用外字集編寫的文件, 還有BBS站的日文(因為BBS站是ANSI環境),可是採用UAO網友編寫的文件中, 如果使用的特殊字本來是Unicode中有的,但是外字集中也有的, 就會被UAO轉成外字集存檔,造成沒裝UAO的網友看到的一般文件也會開始出現缺字, 對沒裝UAO的網友來說,便會造成他的困擾~ 解決方式: 解決方式很簡單~ 第一種,大家統統都裝UAO,可是沒辦法裝的人怎麼辦?所以這是爛方法.... 第二種,全部改成Unicode環境,那已經編寫好的文件誰轉檔?ANSI介面的人怎麼辦 (包括Win95/98以及BBS)?更別說一堆還在DOS底下打滾的人,所以這個方法沒那麼爛, 但是只稍微好一點點... 第三種,折衷,想想我們會碰到ANSI外字的環境,其實不多,只有文件跟瀏覽, 文件可以靠轉檔,但是環境更改就是大麻煩,那文件我們用轉檔,環境用自動支援呢? 這就是PieTTY被推薦的原因,今天一般的使用者,會用到日文的狀況, 大多只有"看",在看的狀況下,網頁部份已解決,只有BBS沒辦法, 所以才會安裝UAO,讓系統對應,而PieTTY本身就內建UAO,所以你的系統不用安裝UAO 這樣的話環境的"大部分"其實算是解決了,文件,就靠轉檔程式吧.... (還有一個方式就是UAO作單向對應,不過有很多問題...算了...XD 說來話長) 最後: 如果以最後要邁向Unicode的結果來看,現階段應該採用第三種方法, 慢慢邁向第二種方法,等到這個世界上沒有任何ANSI的中文環境時, 那就不會有問題了,另外要感嘆的是,這問題只有台灣有,大陸跟香港所使用的字集 中的日文跟特殊字都有被編進Unicode中,唯獨台灣的沒有,所以他們是沒有我們 這個問題的.....T_T -- 歡迎參觀我家的貓.... http://0rz.net/210H3 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 221.169.25.89
thea:先推再看@@! 02/24 13:14
realpiyo:先推再看@@! 02/24 13:16
Leland:小小修正一下,EDU 指的是 EUC-JP 嗎? 02/24 13:20
謝謝了~ 文章已經修正~
evilmask:這個解釋的很完整,可以慢慢看XDDD 02/24 13:20
Mo:@@!看完了推~ (樓上是怎樣= =?) 02/24 13:20
Mo:沒想到恐龍滅亡有這麼大的學問 02/24 13:21
emilwu:是阿...不過字塞不下...像我本來還要打Shift-JIS等有的沒的 02/24 13:21
realpiyo:emil要不要考慮去開個"emil知識+" XDDDDD 02/24 13:22
Mo:順便問一下花大..."滅"的蝦米為什麼是"EFN"~ 02/24 13:22
realpiyo:或者鍵鼠板開個"鍵鼠知識+"之類的 應該會比yahoo還猛XDD 02/24 13:23
evilmask:簡體字的寫法,你在WORD繁簡轉一下或用蝦米轉一下就知了 02/24 13:24
emilwu:不過算了,能夠理解就好,打太多還要解釋有加Shift跟沒加 02/24 13:26
emilwu:Shift的JIS差在那裡...這樣文章太長我會累....XDDDD 02/24 13:26
othree:我有看過說明耶,看完就忘了,反正現在都用Shift_JIS 02/24 13:33
emilwu:一個微軟的, 一個原來的, 你就當作是Big5跟CodePage950~ 02/24 13:35
Leland:好像還是不太一樣說 02/24 13:38
NHyulin:推emil知識+ XD 02/24 13:42
Mo:哇~~"滅"的簡體未免也太簡了吧..... 02/24 13:43
emilwu:不一樣阿~ 不過這樣講最容易理解....XD 02/24 13:44
evilmask:給MO,簡體字雖然有一堆問題,但有他很強的地方XDDD 02/24 13:55
※ 編輯: emilwu 來自: 221.169.25.89 (02/24 14:30)
jeff218:看完了,感謝解釋,終於懂了. 02/24 14:54
surot:伊米爾這篇很中肯,我覺得強迫中獎一定要直接改,這樣不太好 02/24 16:07
cwjchris:看懂了,感謝說明m(_ _)m 02/24 17:38