→ iamweep:你的程式把東吳大學的binary當成UTF-8來解讀而match \w 04/15 07:23
→ godfat:你 $KCODE 設 u 然後讀 big5 不是在欺騙 ruby 嗎 @@ 04/15 11:35
→ ducksteven:這是節錄 原本的程式要同時處理 big5 和 utf8 04/15 13:09
→ godfat:用 ruby 1.8 的話,這樣只能用 byte sequence 來做 04/15 13:41
→ ducksteven::o 意思是我應該把 big5 和 utf8 分開處理囉? 04/15 22:02
→ godfat:當然,而且\w是會match中文字的,你要[A-Za-z]才是英文字母 04/15 22:41
→ godfat:要統一處理就轉個編碼,或是用 1.9.1 吧 04/15 22:41
→ ducksteven:嗯嗯 謝謝 :) 04/15 23:43
→ iamweep:統統轉成UTF-8來做,用iconv 04/16 02:00
→ ducksteven:這個有技術上的困難 因為它有些字是 ...造字... XDD 04/16 03:01
→ godfat:如果是 big5-hkscs, iconv 支援,如 UAO, 海字集,要另找 04/16 10:50
→ godfat:如果是完全自己的造字... 只能自己寫了 XD 04/16 10:50
→ ducksteven:是啊 就是完全造字...XD 04/16 18:02
→ Schelfaniel:完全自己造字有時連 iconv 都會轉失敗,超慘的 04/16 20:38