作者JosephChen (╭(〞▽〝)╭(〞▽〝)╯)
看板DummyHistory
標題Re: [討論] 簡化字及簡繁轉換問題
時間Tue Jan 20 08:45:56 2009
: 關鍵是,誰能先寫一個哪怕最粗糙的胚子出來?我不奢求智慧型詞庫,只先
: 來個最簡單的「手工式」或「審閱式」,可不可以?有沒有?誰能寫好這樣一個
: 轉換程式,必能嘉惠無數網民及專業工作者,清爽無數圖文版面,百年流芳(百
: 世就先不論了),功德無量!
: 給我們一個夠好的簡繁轉換程式吧!
按照這個思路,其實GOOGLE translate已經實做出一個雛形了...
其原理並非單純的詞彙對照,而是按照統計方法,判斷詞彙相關性高低,
來決定哪個字是最佳譯詞。
目前有英文與中文之間的互換,尚未有簡繁互換,但是技術是相同的。
但是按照統計方法的翻譯,前提是資料庫必須整理,否則會有這種狀況:
http://translate.google.com/translate_t?hl=en#en|zh-TW|ABC
http://translate.google.com/translate_t?hl=en#en|zh-TW|DOS
因此GOOGLE也另外推出翻譯服務,撮合找譯者翻譯文件的人,以及願意賺稿酬的譯者。
因此,簡單說,統計方法可以輔助、減輕翻譯的負荷,
但是最終仍需要人力介入,才能處理語意模糊的地方。
: 附錄:
: 《都不錯歌》 作者:沙予
: (原載《文傳論叢:2004年第三屆漢文史資料庫研討會論文集》,文信傳文史研究院。亦
: 載《漢字文化》2006年2期)
: 澳洲華文報刊上同音字混用的現象,人們都已司空見慣,但稱名家郁風為静風,余光中為
: 餘光中,則堪稱為與時俱進之創舉。恰如用問號代替找不到的某些鉛字之不乏創意。審訂
: 和推行簡體字的文字學專家,不會有錯。用電腦把簡體字一律還原為繁體字,以使海外華
: 人看得懂,這更没有錯。現斗膽摘取澳洲報刊上常見的由簡變繁,同音但不同義的字混用
: 的趣事,凑成打油詩《都不錯歌》一首,以娛諸公。此詩平仄不調,對仗不工,當然也没
: 有錯。
: 夏五郭公尋常見,
: 魯魚亥豕久相通。
: 嶽飛追諡尊武穆,
岳飛
: 奕[言宁]登極號鹹豐。
咸豐
: 韋陟豈辭刀削面,
麵
: 劉幫能忍箭傷胸。
劉邦
: 碑成無字武皇後,
皇后
: 卜獲非熊薑太公。
姜太公
: 甦武留鬍十九載,
蘇武 胡
: 鐘馗捉鬼兩三籠。
鍾馗
: 萬裏徵東薛仁貴,
里征
: 單騎救鬥趙子龍。
斗
: 遁居五湖歌範蠡,
范蠡
: 逼上梁山泣林衝。
林沖
: 子曰詩雲四舊也,
云
: 如今題字學干隆。
乾隆
PDF裡的原文根本是故意寫成了「幹隆」
因為「幹」「乾」兩字的簡字都是「干」
乾隆皇當場成了"幹"隆皇 有夠幹...
: (原文有完整註解,網友可於
: http://qkzz.net/magazine/1001-0661/2006/02/hzwh20060236.PDF
: 下載!)
好詩好詩
--
老張開車去東北 撞了 肇事司機耍流氓 跑了 多虧一個東北人 送到醫院縫五針 好了●
老張請他吃頓飯 喝的少了他不幹 他說 ●
俺們那嘎都是東北人 俺們那嘎特產高麗蔘 ╬ ● ◤ 翠花 上酸菜 ●
俺們那嘎豬油炖粉條 俺們那嘎都是活雷峰 \/東\ ●
俺們那嘎沒有這種人 撞了車了哪能不救人 ∕﹨ ●
俺們那嘎山上有珍蘑 那個人他不是東北人 http://joseph-mh-chen.blogspot.com●
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.120.80.19
※ 編輯: JosephChen 來自: 140.120.80.19 (01/20 08:54)
推 chutzpah:Google的方法偷雞. 英雄本色英譯: "A Better Tomorrow", 01/20 10:54
→ chutzpah:但是"A Better Tomorrow"中譯可不是英雄本色 01/20 10:55
推 lovecube:更好的明天? 01/20 11:05
推 baelrog:薑太公害我喝茶嗆到。太好笑了。 01/20 11:20
推 rainmaker2:吳宇森的英雄本色的英文名稱就是A better tomorrow 01/20 11:27