看板 Gossiping 關於我們 聯絡資訊
機器翻譯問題幾乎解決,科學家認為人力翻譯走向尾聲 https://technews.tw/2024/12/17/machine-translation-2/ 科技新報 December 17, 2024 林妤柔 電腦科學家 Vasco Pedro 認為,儘管人工智慧(AI)已經崛起,但機器要像專業翻譯員一 樣翻譯語言,始終需要人的參與。但他看到翻譯平台新創公司 Unbabel 舉辦比賽,針對公 司最新 AI 模型與人工翻譯員進行比較,他發現人類在翻譯瀕臨結束,目前全球翻譯產業中 ,人工約占 95%,但未來三年內人類參與度可能降至零。 70 多年前,第一次電腦翻譯是使用一台 IBM 電腦,其程式被編入 250 個英語和俄語單字 以及六條語法規則。這種「以規則為基礎」方法到了 1990 年代被基於處理大數據集的「統 計」方法取代,而 Google 在 2006 年推出以機器學習為基礎的 Google 翻譯(Google Tra nslate),是當時最先進技術。但到 2016 年,Google 轉用「神經」引擎,即大語言模型 (LLM)的前身時,這個領域開始出現爆炸性發展。 在 Unbabel 測試中,人類與機器譯者被要求翻譯各種內容,從隨便的文字訊息到密集的法 律合約,還有馬可.奧理略(Marcus Aurelius)所著《沉思錄》舊譯本中的古老英文。從 結果來說,Unbabel 的 AI 模組完全不落下風。 另據追蹤翻譯品質的 Multidimensional Quality Metrics(多維品質度量)框架衡量,如 果人類精通兩種語言,同時是領域翻譯專家(如處理合約的專業法律譯者),人類表現會比 機器更好。但從現在看,Pedro 認為兩三年後,很難想像機器不會完全超越人類。 羅馬 Translated 老闆 Marco Trombetti 創造一種不同的機器翻譯品質測量方法,稱為編 輯時間(TTE),這是人類翻譯員檢查機器翻譯謄本所需的時間。當謄本錯誤越多,人類所 需的時間越長。在 2017 年至 2022 年間,在十種翻譯最多的語言中,TTE 從每字三秒降至 兩秒,Trombetti 預測未來兩年內 TTE 將降至一秒。 翻譯考驗直翻還是融入當地說法 Google 翻譯研究員 Isaac Caswell 指出,那些擁有最多訓練資料的「高資源」(high-res ource)語言而言,將句子翻成另個句子的問題「幾乎已經解決」,但要達到多語言人士的 水準,或者那些沒大量可用訓練資料的語言而言,是項艱鉅任務。 此外,由於無法規劃、參考長期記憶、從事實資料來源或修改輸出,即使是最好的翻譯工具 也很難處理長篇大論的工作或精確任務,另外也可能為了符合目標語言的語法結構,而「幻 覺」出他們不需要的資訊。Caswell 認為,「要獲得完美的翻譯,還必須擁有人類水平的智 慧,沒有一個有能力的詩人,是很難翻譯俳句的」。 事實上,翻譯長期都在「透明度」(transparency)與「保真度」(fidelity)之間掙扎, 該選擇完全照原文翻譯,還是考量目標受眾的感受進行翻譯。前者會保留語詞組的原貌,後 者則會改變整個文化參考,翻譯出更貼近當地文化的用語。有時甚至需要比原始資料更多的 資訊,例如將「我喜歡你」(I like you)這句話翻成日文,需要知道說話者的性別、他們 與對方的關係及對方名字,以避免不禮貌地使用「你」這個字。 進階翻譯需要更多資訊,不只是原始文字 德國 AI 新創 DeepL 創辦人 Jarek Kutylowski 表示,要求提出後續問題、知道何時以透 明度換取保真度,以及了解翻譯目的,意味進階翻譯需要更多資訊,而不只是原始文字。 再來是「資源匱乏」(low-resource)語言的問題,這些語言的書面文字稀少,意味翻譯準 確性無法透過 LLM 突破來改善。針對這類狀況,Google 團隊建立一套系統,為 15 種非洲 語言增加語音到語音的翻譯,這並非根據數千兆位元組的音訊資料進行訓練,而是像小孩一 樣學習閱讀書面上的文字,將語音與書面上的字符序列聯繫起來。 即時翻譯軟體 DeepL 也於 11 月推出語音對語音翻譯系統,提供一對一的當面對話和多人 視訊聊天的口譯服務。與此同時,Unbabel 展示一款裝置,能讀取手腕或眉毛的細微肌肉動 作,並將其與 LLM 產生的文字配對,讓人們無需說話或打字即可進行溝通。該公司打算將 這項技術製成一種輔助裝置,用於那些無法自己說話的運動神經病症患者。 Google 翻譯研究員 Caswell 表示,翻譯工具對於探索世界非常有用,但它們只是一種工具 ,無法取代人類學習語言的經驗,例如真正了解其他人的出身,了解不同地方是什麼樣子。 ----------- 如果是翻譯本本我想肯定沒問題 但是要“信、達、雅”的翻譯 應該沒那麼容易吧,還是AI 學習能力真的那麼厲害,3年內取代人類? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.9.67.95 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1734594966.A.131.html
HuangJC: 人類是在 debug 的.. 123.110.95.251 12/19 15:56
scores: 可能不用三年 1.171.111.142 12/19 15:56
IslamicState: 所以不用考英文了嗎? 60.248.106.181 12/19 15:57
HuangJC: 我要為十分努力 <= 昨天看片看到的字幕 123.110.95.251 12/19 15:57
HuangJC: 正確的是:火藥味十分濃郁 123.110.95.251 12/19 15:57
HuangJC: 當然,機器會愈來愈好,但訓練資料裡也有 123.110.95.251 12/19 15:58
magicchase: 那為什麼IG、YT上的翻譯跟垃圾一樣 42.70.78.17 12/19 15:58
alex00089: 翻譯蒟蒻要 223.139.54.137 12/19 15:58
rossikao: 所以不用英檢了對吧? 163.16.118.4 12/19 15:58
HuangJC: 人會丟垃圾進去訓練,ai 出錯時超扯的.. 123.110.95.251 12/19 15:58
flux: 以後就是留一個人負責校正AI的翻譯就好 111.83.70.138 12/19 15:59
lats: 語言類補習班要消滅了嗎 1.163.248.152 12/19 15:59
HuangJC: 那你看看現在網路新聞,錯字多不多.. 123.110.95.251 12/19 16:00
oyaji5566: AI配音 遇到破音字也不會轉換讀音223.140.174.110 12/19 16:00
HuangJC: 結論是:校正其實很花人力 123.110.95.251 12/19 16:00
nekoares: 三年後沒有的話 我要槍斃你可以嗎111.248.114.171 12/19 16:00
HuangJC: 以前就是做事的人多,所以隱含校正的人多 123.110.95.251 12/19 16:00
GLUESTICK: YT還是繼續卡繁中翻譯 125.230.81.189 12/19 16:01
HuangJC: 現在一堆人力被取代,但校正的人力卻少了 123.110.95.251 12/19 16:01
l2l: 等AI出錯率比最專業翻譯人士低時就完全取代了115.165.192.162 12/19 16:01
HuangJC: 其實 ai 給出的利益應該給使用者(勞方), 123.110.95.251 12/19 16:01
vvrr: 火藥味變成我要為,那不是翻譯的問題。 60.250.31.103 12/19 16:01
HuangJC: 是勞方操作資方,而不是把利益給資方(裁 123.110.95.251 12/19 16:02
vvrr: 搞不好是人打字錯誤… 60.250.31.103 12/19 16:02
HuangJC: 員),自動駕駛也是,是司機開自動駕駛的 123.110.95.251 12/19 16:02
HuangJC: 車,司機要負全責;而不是乾脆不要司機 123.110.95.251 12/19 16:02
HuangJC: 讓無人車在路上跑.. 123.110.95.251 12/19 16:03
HuangJC: 那個不是打字啊,那是 AI 聽打.. 123.110.95.251 12/19 16:03
HuangJC: 無人車開車技術其實就是閹割版,不是不行 123.110.95.251 12/19 16:04
HuangJC: 比如,只能開高速公路最右道,時速 60 123.110.95.251 12/19 16:04
herculus6502: 破音字的問題遲早會解決 36.236.220.39 12/19 16:04
HuangJC: 自動化介入多,就像 ai 美女;是沒瑕疵 123.110.95.251 12/19 16:05
HuangJC: 沒錯,但就有點硬不起來.. 123.110.95.251 12/19 16:05
HuangJC: 以後 ai 翻譯,是沒瑕疵沒錯,但就沒有 123.110.95.251 12/19 16:06
HuangJC: 看小說的興奮感。 大概可用在專業,科學 123.110.95.251 12/19 16:06
HuangJC: 反正你不在乎美感的地方.. 123.110.95.251 12/19 16:06
yw1002: large language model118.166.138.211 12/19 16:09
karkkunt: 太旱 111.71.214.8 12/19 16:10
vvrr: 之前的新舊魔戒翻譯之爭 新版就被說看起來像 60.250.31.103 12/19 16:13
driver0811: 不曉得能否有二維碼反組譯為程式碼的 111.71.107.157 12/19 16:13
driver0811: 一天 111.71.107.157 12/19 16:13
b777787: 文組哈哈文組 42.73.16.19 12/19 16:14
vvrr: 機翻。有些句子讀起來就是怪怪的 60.250.31.103 12/19 16:14
vvrr: 這篇在講翻譯,跟聽打是兩回事啊= = 60.250.31.103 12/19 16:14
rogergon: 以後就不用字幕組了 101.12.100.252 12/19 16:22
kikujiro: 朱學恒確實走向尾聲了QQ 111.252.98.90 12/19 16:23
clair281: 老實說再多幾年數據應該真的差不多了 39.15.57.15 12/19 16:25
a71085: 就看一年AI日文翻譯網路小說的感想 現在很 114.37.109.207 12/19 16:25
a71085: 吃作者本人的文法 作者文法太爛翻出來跟機 114.37.109.207 12/19 16:26
a71085: 翻差不多都是一坨大便 作者文法好翻出來配 114.37.109.207 12/19 16:26
a71085: 好的術語表都能看得很開心了 114.37.109.207 12/19 16:26
imtifosi: 這科學家好天真好樂觀223.141.141.141 12/19 16:33
blessme: 人工翻也要翻譯員文學素養夠才會順125.228.223.166 12/19 16:35
xBox1Pro: Vrr你搞錯了,侍新版魔戒(李涵)翻譯 123.194.9.80 12/19 16:38
xBox1Pro: 得比GPT機翻還差 123.194.9.80 12/19 16:38
sali921: 我就問台語翻譯有嗎223.138.246.130 12/19 16:38
xBox1Pro: 機翻很難判斷同音詞、也聽不懂「語境」 123.194.9.80 12/19 16:41
xBox1Pro: (上下文),所以這就很弔詭,如果你找 123.194.9.80 12/19 16:41
xBox1Pro: AI翻之後再人工校對,那我什麼不直接找 123.194.9.80 12/19 16:41
xBox1Pro: 人工翻 123.194.9.80 12/19 16:41
daye2012: 真的,我最近在看原文書, 模組可以九 27.51.40.61 12/19 16:41
daye2012: 成沒問題,翻得比真人還好 27.51.40.61 12/19 16:41
boss88893: 看YT 沒辦法 即時翻譯啊 一堆錯 111.250.60.168 12/19 16:42
boss88893: YT 直播 你有辦法即時翻譯嗎? 111.250.60.168 12/19 16:42
Forcast: 口譯高升 114.25.142.10 12/19 16:43
LiangNight: 速度確實快的恐怖 1.172.19.128 12/19 16:45
xBox1Pro: 英文論文的格式、用詞、句法都早就很有 123.194.9.80 12/19 16:46
xBox1Pro: 規範性了,但難點一直在如何判斷哪一個 123.194.9.80 12/19 16:46
xBox1Pro: 專有名詞比較好,比方說grammar可翻譯 123.194.9.80 12/19 16:46
xBox1Pro: 成文法或語法,你要採用哪一個是牽涉學 123.194.9.80 12/19 16:46
xBox1Pro: 術判斷的 123.194.9.80 12/19 16:47
xBox1Pro: AI各領域達到9成翻譯工作量是可能的, 123.194.9.80 12/19 16:49
xBox1Pro: 但三年內人工翻譯0%是不可能、絕對不可 123.194.9.80 12/19 16:49
xBox1Pro: 能 123.194.9.80 12/19 16:49
xBox1Pro: 微軟都在用AI翻譯輔助遊戲、系統介面, 123.194.9.80 12/19 16:50
xBox1Pro: 結果之前微軟把indie翻譯成印度群島, 123.194.9.80 12/19 16:50
xBox1Pro: 最蠢的是這麼低級的錯誤還沒被抓出來 123.194.9.80 12/19 16:50
nalthax: 校正比翻譯還累耶 218.164.159.60 12/19 16:51
asdf70044: 樂觀其成這種AI 116.59.173.90 12/19 16:52
JackTheRippe: 是像網飛那種嗎 可怕 42.74.99.190 12/19 16:53
Eligor41: 現在機翻程度的翻譯還是會被笑吧 49.216.34.223 12/19 16:55
Eligor41: 只有信的部分 也就是逐字翻可以 達跟雅 49.216.34.223 12/19 16:57
Eligor41: 的部分還差很遠 49.216.34.223 12/19 16:57
Jameshunter: 新版魔戒只贏沒AI的機翻 GPT都屌打 140.109.214.4 12/19 16:58
yesyesyesyes: 不意外,AI現在的功能很強大 210.202.18.142 12/19 17:01
Arashi0731: 人類只負責校驗了吧,教語言的差不多 111.82.1.206 12/19 17:08
Arashi0731: 都要失業了 111.82.1.206 12/19 17:08
Retangle: 人類還是要提供訓練的標準資料跟debug 101.12.29.202 12/19 17:10
StarTouching: 信達雅已經是過時的標準了 211.72.117.63 12/19 17:12
yteewt: 鬼扯AI可以參考各種書本翻譯版本吧 101.9.195.154 12/19 17:12
lulocke: 先把Steam上的色色遊戲翻好一點吧 114.36.218.26 12/19 17:14
Ligamenta: 村上春樹沒有賴明珠的翻譯還能是村上嗎 116.59.201.247 12/19 17:21
jeff0811: 還差很多 101.9.137.211 12/19 17:26
jeff0811: 特別是聽譯部份 101.9.137.211 12/19 17:26
qxpbyd: Claude GPTo1 Gemini2.0的翻譯 不再只有逐 123.192.159.73 12/19 17:30
qxpbyd: 字翻了 只要prompt下對 可以翻得很好 只是 123.192.159.73 12/19 17:30
qxpbyd: 還是會翻錯 一定要校對 123.192.159.73 12/19 17:30
hank814028: 英文而已吧,你去看看韓文翻譯出來是 111.82.14.78 12/19 17:31
hank814028: 什麼東西 111.82.14.78 12/19 17:31
Refauth: 師大翻譯所全體同仁表示: 118.169.92.208 12/19 17:38
takako1014: 人力翻譯哪打的營AI,語言是最快訓練 101.9.207.192 12/19 17:44
takako1014: 現在你還在笑,明年通通捲布蓋走人 101.9.207.192 12/19 17:45
yuinghoooo: 有嗎 怎麼看都覺得翻譯的很爛啊114.136.152.195 12/19 18:20
iso90024: 等AI可以把中文詩詞流暢的翻譯成英文再 220.142.4.29 12/19 18:37
iso90024: 說 220.142.4.29 12/19 18:37
amethystboy: 你們那一個讀paper的不翻譯的 說啊 1.164.65.235 12/19 18:45
SALEENS7LM: 翻出來這狗屎大便,還淘汰個屁人力, 27.53.104.223 12/19 18:48
SALEENS7LM: 沒腦吧這群小丑 27.53.104.223 12/19 18:48
vincent8914: 夏目漱石:? 42.77.7.79 12/19 18:55
leterg: 中國白話文完全西化,所以他們一直以來翻 1.200.136.46 12/19 19:11
leterg: 譯書籍的語法就是英文的樣子 1.200.136.46 12/19 19:11
leterg: 就很機翻 1.200.136.46 12/19 19:11
leterg: 台灣人讀了會覺得不文雅,就那種感覺 1.200.136.46 12/19 19:12
iComeInPeace: 問題是 廠商會不會用吧 219.70.32.137 12/19 19:57
iComeInPeace: 網飛那爛翻譯連google都不如 219.70.32.137 12/19 19:57
Frobel: 翻譯不會消失 會轉換工作模式 36.224.85.205 12/19 22:03
Frobel: AI一次給出大批翻譯 人員校正 36.224.85.205 12/19 22:03
jehow: 什麼時候能有連結大腦的晶片 還能隨時更新 220.129.88.225 12/19 22:38
VBMO: 讀paper要用翻譯才讀得下去是應該是這6.7年 111.82.108.98 12/20 08:10
VBMO: 的事 以為全台都這種水準喔?笑死 111.82.108.98 12/20 08:10