精華區beta Wikipedia 關於我們 聯絡資訊
關於簡繁轉換,我也來說說我的看法 語言最基本的兩個部分是語法跟語意 (syntax & semantics) 用詞、語氣關係到語法的部分比較容易解決 大多可以透過字串比對 (pattern recognition) 的方式做轉換 然而語意的部分才是真正困難的部分 語意解析 (semantic interpreter) 才是翻譯軟體的核心價值 我想現階段的簡繁轉換要做的應該是字碼轉換 至於詞彙的部分,可以慢慢累積 如果只要達到一定程度的可接受度 其實只要簡單的簡繁體轉換加上詞彙翻譯 (查表法) 即可 這點若不考慮版權問題 我覺得 ConvertZ 裡面的對照表就不錯了 ( 跟 vmp 提過的 ALiBaBar 是同一位作者的作品 ) 例如︰ 簡繁字碼轉換 詞彙翻譯 簡體內容 ────── 暫時內容 ──── 繁體內容 至於外來翻譯詞彙的部分 例如︰布什、布殊、布希 這三個詞講的都是美國總統 George W. Bush 我覺得放在獨立項目,加上「亦作xx,用於xx地區或xx語言」也無妨 最後,談談比較現實的問題 實際上兩岸的用語已經越來越統一了 或者說已經有越來越高的「接受度」 就像「水準」與「水平」,你會用哪一個呢? 我們在語言中已經接受了非常多的日本漢字詞彙 我相信同樣的趨勢會以更快的速度發生在兩岸詞彙的部分 所以我想這點應該沒什麼好擔心的 至於非中港台三地詞彙的使用者 限於我對於該類詞彙的所知不多,就不贅言了。 -- 如同一種自言自語的場景,一個空白舞台,荒涼的燈光映著搖晃的亮度, 點點暈黃將黑暗的空間切分成凌亂不均的模糊,明滅之間如此曖昧不明。 -- sunpoet -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 203.204.205.212
MilchFlasche:不過詞彙擴散過程中,仍會有人有所偏好, 61.223.132.96 03/16
MilchFlasche:所以畢竟還是要照顧偏好台灣用語的繁體用戶 61.223.132.96 03/16