看板 TW-language 關於我們 聯絡資訊
雖然有人轉了,不過底下的留言也蠻有價值,所以一併轉了 並也再附上 PPT 創世神 的臉書評論 ---------------------------------------------------- Ethan Tu 6h · 雅婷逐字稿本來就有台語即時翻譯成英文了唷 https://asr.yating.tw 台語即時辨識翻譯在台灣業界有兩年多了吧,很多公司有介接使用我們的API。 您可能不知道科技部與教育部計畫,用三年(2019-2022)的時間,以建立人工智慧台語 語音資料庫全台收集至少300小時,600位語者的台語語音(6音軌錄製)。這讓全世界科 技公司研究台語語音資料的濫觴,在臉書的論文也有提到TAT資料集貢獻。 感謝臉書認證成果困難度,也歡迎台灣團隊加入使用或研究! 台灣人下載使用雅婷逐字稿就是對我們最好的支持。 -------------------- 作者: RungTai (RungTai) 看板: TW-language 標題: Fw: [情報]祖克柏推出AI口譯 閩南語無文字也可翻譯 時間: Thu Oct 20 19:04:50 2022 ※ [本文轉錄自 C_Chat 看板 #1ZK3SSWZ ] 作者: medama ( ) 看板: C_Chat 標題: [情報]祖克柏推出AI口譯 閩南語無文字也可翻譯 時間: Thu Oct 20 01:42:50 2022 之前因「元宇宙」遊戲人數不如預期而虧損的meta https://i.imgur.com/gCXvLX7.png
今天祖克柏宣布將推出AI口譯系統 即使是沒有統一標準書寫系統的閩南語(HOKKIEN) 雖然難以利用文字翻譯軟體, 但透過AI技術,也能讓閩南語即時跟英語進行雙向口語對譯 展示影片: https://reurl.cc/KQZbGM 等AI技術更加精進後 想必之後在meta的「元宇宙」遊戲中 各國玩家可突破語言藩籬,彼此聊天 創造出一個嶄新的宇宙 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.217.25.125 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1666201372.A.823.html ※ 編輯: medama (180.217.25.125 臺灣), 10/20/2022 01:44:45
buke: 點開圖就笑了 10/20 01:45
LEONLOL: 這個人最大的貢獻是賣便宜vr頭盔吧== ai口譯難道會開源 10/20 01:46
LEONLOL: 給所有人用嗎 10/20 01:46
Mark Zuckerberg : Meta AI built the first speech translator that works for languages that are primarily spoken rather than written. We're open sourcing this so people can use it for more languages. 台灣八十歲阿嬤不會電腦打字 但之後講台語就能跟元宇宙裡的美國人溝通 這樣不是很好嗎?
BITMajo: 看展示影片是還不錯啦,比原宇宙實際多了 10/20 01:47
BITMajo: 有種朝ST的萬用翻譯機方向發展的感覺 10/20 01:48
BITMajo: 沒有書寫系統的語言通常不會是官方語言 10/20 01:49
bluejark: 這也是他元宇宙的一環啊可以跨國聊天 10/20 01:49
BITMajo: 這種不開放給大眾使用,能活用的範圍就很小了吧 10/20 01:49
他要推元宇宙遊戲啊 研發這個成功後 就算不會講外文 也可以跟元宇宙遊戲裡的外國人溝通
killeryuan: 台語不管漢字還是台羅都很難推 乾脆用英文算了 10/20 01:50
BITMajo: 如果原宇宙是棟房子,這只能算房子的門而已 10/20 01:50
bluejark: 還有這是不是新加坡人開發的 10/20 01:50
bluejark: 說到拼音 東南亞就有福建話拼音 中國也有閩南語拼音 10/20 01:52
bluejark: 台灣要搞的台語拼音又要跟他們不同 10/20 01:53
對啊 影片有說 閩南語沒有統一的書寫系統 很難利用文字翻譯 因此就開發AI語音翻譯
egg781: 他是不是把一切都賭在元宇宙上了? 10/20 01:53
※ 編輯: medama (180.217.25.125 臺灣), 10/20/2022 01:53:53
LEONLOL: 元宇宙遊戲真的別提了 vr圈裡面最丟臉的概念 10/20 01:53
asiakid: 那個翻譯系統講英文很明顯有電子音 閩南話卻沒有 10/20 01:53
HHiiragi: 很棒 可是遊戲看起來還是很垃圾 10/20 01:54
LEONLOL: 開源那行吧 看哪天我阿嬤真的用到了再說 10/20 01:54
asiakid: 我是覺得用剪接造假的可能性不小啦 10/20 01:55
祖克柏會用剪接造假? 今天又不是愚人節 ※ 編輯: medama (180.217.25.125 臺灣), 10/20/2022 01:55:53
buke: 即時翻有點猛,如果之後擴展到其他語言的話,所以150億是花 10/20 01:56
buke: 在研發這個嗎 10/20 01:56
ianpttptt: 台灣的拼音比較完善 中國那邊閩南語的自媒體 貼吧 論壇 10/20 01:56
ianpttptt: 也會用 10/20 01:56
ianpttptt: 所以是開發翻譯年糕? 10/20 01:57
BITMajo: https://youtu.be/1wJRjQ_wMzA?t=64 10/20 01:57
BITMajo: 這裡有比較搞笑的造假 10/20 01:57
longlongint: 如果不能翻賴打 會被台灣人客訴嗎 10/20 01:57
我不知道打火機其他地區的閩南語怎麼叫 但開發出來後 也可以分台灣閩南語、漳州閩南語、泉州閩南語等各版本啊
BITMajo: 不知道髒話會不會被自動屏蔽XDDD 10/20 01:58
HHiiragi: 造假沒必要吧 不過實際上沒那麼猛的可能性應該很高 10/20 01:59
演示影片一定是事前先排演過 實際上不可能每一句都那麼順 但這是全球第一個閩南語跟英語對譯的軟體 意義非常重大 ※ 編輯: medama (180.217.25.125 臺灣), 10/20/2022 02:00:52
yangtsur: 不用學英文了 10/20 02:06
buke: 厲害 好奇英文翻福建話怎麼翻的 10/20 02:09
就跟英翻中一樣啊 只是之前的翻譯軟體都是餵文字資料訓練 這個是餵語音資料訓練 ※ 編輯: medama (180.217.25.125 臺灣), 10/20/2022 02:11:18
kimisawa: 一定要餵AI吃國罵三字經五字經N字經 讓世界知道台語罵人 10/20 02:17
kimisawa: 的厲害 10/20 02:18
ncturw: https://youtu.be/n9TlOhRjYoc 4:35 10/20 02:21
ncturw: 台語的語音辨識台灣也有人在做 10/20 02:22
trnkcity: 明明就很猛好嗎 10/20 02:25
BITMajo: 他的翻譯重點大概是會不侷限於台語翻譯 10/20 02:26
BITMajo: 最後應該會做成任意兩種語言之間都可以翻譯 10/20 02:26
egg781: 地球翻譯機嗎?還是很難想像 10/20 02:27
egg781: 不過翻譯的確有感覺到比起以前進化很多,水管的自動翻譯 10/20 02:28
MoritzCL: 欸欸示範的工程師是我大學同學 10/20 02:29
egg781: 讓我這個外語差的至少大概知道在講些甚麼 10/20 02:29
egg781: 但是有背景音樂的就不行了~無法辨識 10/20 02:30
power41: 台灣人開發的 強者我同學 10/20 02:33
zizc06719: open source耶,全部推廣後,跟國外開會就好多了 10/20 02:36
buke: http://i.imgur.com/Lr9ZPID.jpg 10/20 02:37
buke: 好有趣 10/20 02:37
SweetRice: cyberpunk comfirm 10/20 02:43
http: 這個好猛哦 10/20 02:45
KaryuuIssen: 台語跟中文很好對接 所以重點還是中英之間的翻譯 10/20 02:46
aegis123321: 怎麼強者都是鄉民同學 好扯 10/20 02:46
KaryuuIssen: 要做得很好 10/20 02:46
js850604: 意思是語音直接翻不先轉文字了? 10/20 02:48
Aliensoul: 這還不錯阿 10/20 02:49
pf775: 福建人聽得懂台語嗎 10/20 02:49
buke: 這麼猛還開源 10/20 02:49
asiaking5566: 祖我超 10/20 02:50
Lb1916: 現在能翻譯的是什麼腔調? 10/20 02:50
Lb1916: 漳泉混合腔嗎? 10/20 02:51
Lb1916: hokkien是狹義閩南語也就是閩南語 10/20 03:00
Lb1916: 泉漳片,是廣義閩南語中最主流的, 10/20 03:00
Lb1916: 新馬華人稱為福建話。 10/20 03:00
gekisen: 每講2分鐘自動插播30分鐘的廣告而且不能跳過 10/20 03:02
Lb1916: 其下還有分漳州話or台灣話漳腔、泉州話or台灣話泉腔、廈門 10/20 03:03
Lb1916: 話or台灣話混合腔等 10/20 03:03
Lb1916: https://zh.m.wikipedia.org/wiki/泉漳片 10/20 03:03
Lb1916: 感覺是個厲害的技術,期盼之後的發展 10/20 03:04
qweertyui891: 這翻譯聽起來真的很道地 10/20 03:10
cambusyer: J系在戲蓋讚 -> This is awesome 10/20 03:14
woaifafewen: 這個就台灣閩南語 真的泉州話漳州話你只能聽懂7成 10/20 03:40
woaifafewen: 就算是廈門話頂多也聽懂9成 10/20 03:40
HHH555JJJ: 這個真的屌 10/20 04:04
dannyko: 抱歉了台羅 但我真的需要這個酷東西 10/20 04:36
AmigoSin: 推李宏毅! 10/20 04:49
wei115: 閩南語寫文言文就好了R(誤 10/20 04:53
ryohgi: 台羅仔優越感沒了哭啊 10/20 06:25
UshiKyuu: 標題沒文字真的笑死 亂下 10/20 06:57
UshiKyuu: 說真的 某些留言因為台語不需要文字透露出欣喜的感覺就 10/20 07:00
UshiKyuu: 是看不起台語啊 目前白話字跟它的變體(台羅+泉腔韻母 10/20 07:00
UshiKyuu: )早就能完全標記各地的泉漳片 連馬來西亞講福建話運動 10/20 07:00
UshiKyuu: 都有用 10/20 07:00
UshiKyuu: 而且重點是 口譯跟用文字翻譯本來就不一樣的東西 就算 10/20 07:02
UshiKyuu: 今天華語沒有文字 人家一樣也能做華英口譯系統啊 == 10/20 07:02
UshiKyuu: 今天要用文字表達準確的台語還是得靠台文 華語人真的只 10/20 07:05
UshiKyuu: 覺得台語只需要停留在語音的層面耶 結果造成的是需要用 10/20 07:05
UshiKyuu: 書面載體的時候都是用華語在思考 變相犧牲自己的台語能 10/20 07:05
UshiKyuu: 力 10/20 07:05
opengaydoor: 如果真的能完成 超猛 10/20 07:24
TaiwanFight: 問一下 台語是什麼?? 10/20 07:27
TaiwanFight: 是指99%台灣人都會的那個語言?是的話那我知道指什麼 10/20 07:29
WindHarbor: 看到台語就崩潰的人真的滿可憐的 10/20 07:41
holiybo: 元宇宙不解決語言問題就是個笑話 現在終於肯面對現實了 10/20 07:41
LordSo: 至少這個很明確知道目標跟要解決哪些問題 比空中樓閣好 10/20 07:46
moonshade: 我還蠻驚訝閩南語英文叫"福建" 10/20 08:20
moonshade: 所以閩北語跟福州話都不能叫福建語 10/20 08:20
moonshade: 全中國的方言全部都有同文異聲,這在古代的韓國 10/20 08:21
moonshade: 和日本書寫漢字都有一樣的用法 10/20 08:21
moonshade: 在粵語叫書面語 10/20 08:24
emptie: 近年來少數覺得meta有前景的產品 10/20 08:26
longkiss0618: 怎麼會有台語警察 中國人是不是= =? 10/20 08:40
lungyu: 我記得東南亞各地華僑都會稱閩南語為福建話 所以英譯用 10/20 08:44
lungyu: 福建代稱? 10/20 08:45
scotttomlee: 五告讚!不過讓各地不同閩語能通英文的話,150e夠嗎 10/20 08:48
scotttomlee: ?(現在ai不知道進展到什麼地步了 10/20 08:48
Tsukasa0320: 除了語言學家哪管你這麼多 10/20 08:59
Tsukasa0320: 反過來講 英蘇威美加紐澳 我們不也全都叫「英文」 10/20 08:59
Tsukasa0320: 沒多少人會在那邊分高蘇低蘇之類的 10/20 09:00
Vulpix: 泉漳片自稱「福建」,那是祖宗自大的問題,來不及補救了。 10/20 09:01
AAA891216: 一個語言不能有兩個名字嗎 到底在堅持什麼 10/20 09:07
hitlerx: 這樣若有其他語言版本 Vtuber可以進元宇宙開雜談 10/20 09:23
hitlerx: 然後那些太黃的雜談V馬上被祖w 10/20 09:24
cn5566: 有點料 但這跟元宇宙沒有關係就是了 10/20 09:55
king9122: 推 這比什麼元宇宙棒多了 10/20 09:55
pig0038: FB 這種大公司要賺的是平台跟生態系,產品都弄免錢的 10/20 09:59
greg90326: 什麼跟元宇宙沒關係... 這就元宇宙的一環阿 10/20 10:00
jason1515: 這麼猛? 腔調跟地方用語不知道能不能都一樣準 10/20 10:09
leviathan36: 幾千年羅漢文盲語,陳元光出面負責。 10/20 10:09
nettlefish: 這種AI訓練過+open source 基本上就能與全人類溝通了 10/20 10:14
bh2142: 原宇宙做那麼爛,我繼續用vrchat不就好了 10/20 10:18
danny10173: 這個方向就不錯,比白癡meta verse 好多了 10/20 10:58
arrenwu: 這跟元宇宙關係很大啊 XD 10/20 11:14
penta: 這個project就是跟元宇宙相關的啊XD 10/20 11:15
k880614: 太酷了吧 10/20 11:42
JER2725: 閩南語 台灣南部和中部沿海口音就不一樣了 台灣和廈門很 10/20 12:23
JER2725: 多用語不同,尤其是日語當外來語的部分 10/20 12:23
Nuey: 其實真的滿厲害的== 10/20 12:23
diabolica: 祖克柏 我的超人 10/20 12:57
tekamolo: 樂觀其成!但標題有誤,台語一直都可以書寫的 10/20 13:00
medama: 可以書寫沒錯 標題的無文字不是指不能書寫 是指 10/20 13:02
medama: 是指沒有可供AI學習的文字記錄 10/20 13:02
tekamolo: 在收音機出現前,說台語的人都能用漢字溝通 10/20 13:02
WinRARdotrar: 不得不說這的確滿屌的 10/20 13:03
tekamolo: 純台文(全拼音或漢字為主)的出版品現在很多呀! 10/20 13:05
tekamolo: 希望我們可以拿下台語的文字書寫標準 (握拳) 10/20 13:05
nthulibrary: 台灣內部就搞不定了還想統一閩南語 10/20 13:11
tekamolo: 樓上想必熱愛JQX 你的閩南語不是我的台語 統一都給你吃 10/20 13:13
medama: 那些古代人都死了啊 用的文字也不符合現代需求 10/20 13:16
medama: 祖克柏是要做元宇宙 翻譯只是達成目標的手段 10/20 13:17
medama: 台語書籍非常少(跟其他熱門語言相比)直接用語音訓練更 10/20 13:18
medama: 快 10/20 13:18
nthulibrary: 那你說的希望「我們」可以拿下台語的書寫標準是什麼 10/20 13:59
nthulibrary: 意思 你是以某種書寫系統的推廣人身分說的還是以台 10/20 13:59
nthulibrary: 灣人身分說的 10/20 13:59
nthulibrary: 如果是後者 那你說的話就很矛盾了 10/20 13:59
nthulibrary: 既然你只想管台語不想管其他和台語相近的閩南語 何 10/20 13:59
nthulibrary: 必強調我們 10/20 13:59
nthulibrary: 如果範圍限定在台灣 不管誰來訂標準都是「我們」拿 10/20 14:00
nthulibrary: 下啊 10/20 14:00
nthulibrary: 如果範圍擴大到大陸、東南亞的閩南語 那就叫閩南語 10/20 14:01
nthulibrary: 書寫標準而不是台語書寫標準 10/20 14:01
harryzx0: 這真的很屌 台語的口譯不容易 10/20 14:21
※ 發信站: 批踢踢實業坊(ptt.cc) ※ 轉錄者: RungTai (125.231.105.92 臺灣), 10/20/2022 19:04:50 ※ 編輯: RungTai (125.231.105.92 臺灣), 10/20/2022 19:07:48
tbrs: 福建的臺語發音其實就是hokkien,而福建的官話發音是fuchian 10/23 20:44
saram: google有韓語翻中文.但翻起來怪怪的.後來我發現系統把韓語 10/24 02:34
saram: 翻成日語再翻成中文. 10/24 02:34
saram: "偷吃步" 10/24 02:34
saram: 這一招用在少數語言上很管用.如果中翻英資料庫很成熟,那 10/24 02:35
saram: 只要把台語語音(含共用漢字)先成中文就好辦了. 10/24 02:36
saram: 腦子要清楚一點.業者只是在誇大,博得大宣. 10/24 02:37
saram: 接下來,同樣招數,把漢語方言先翻成中文..... 10/24 02:39
saram: 因為漢語文法都一樣. 10/24 02:39
saram: 台灣人真好哄 10/24 02:40
CCY0927: 哈哈哈哈哈,「漢語文法都一樣」?鍵盤句法學家,是你? 10/24 09:20
MilchFlasche: 無讀冊saram閃較邊啦 10/24 16:22
tbrs: 臺語及福建話都有賓語提前語法 10/25 19:40
tbrs: 基本上我習得的臺語語法是臺語北京語的混合體 因為北京語太 10/25 19:42
tbrs: 流利而沒有老派臺語的feel 10/25 19:42
MilchFlasche: 我嘛是無啥老派感QQ 10/26 17:41
saram: 生意人招數.丟一個話題如丟一塊臭肉,引來蒼蠅,是要捕蒼蠅 10/26 22:45
saram: 因為業者對國語白話翻英文已經有把握了.但他們不懂台翻中 10/26 22:48
saram: ,而台灣有太多人台國語皆通的,這些人有了熱情動力,是免洗 10/26 22:50
saram: 勞工,把台語語音翻成國語文字檔後,業者就撿便宜了. 10/26 22:50
saram: 以國語語音輸入瀏覽器檢索已經成熟.我見過小孩子沒用文字 10/26 22:54
saram: 輸入卻對手機喊歌星名字,很快找到要聽的影音檔. 10/26 22:55
saram: 他甚至也不會注音符號. 10/26 22:56
saram: 國語音可以,其他語音當然也行. 10/26 22:56
saram: 只不過多一個資料庫. 10/26 22:57
saram: 而機器計算速度也越來越快.非常有利於語音輸入檢索. 10/26 22:59
saram: 小時候看美國電影有"語音直翻語音"機器,我想那很唬爛.但現 10/26 23:02
saram: 在已經是接近事實了. 10/26 23:02
CCY0927: 沒想到 saram 上一秒還是漢語句法學家,現在又變成語音辨 10/27 00:06
CCY0927: 識暨合成專家了 10/27 00:06
saram: 不敢當.不過沒是我會玩玩線上翻譯.對於語音的發展有著興趣 10/27 06:02
saram: 估狗翻譯初來時,我有個感概:照業者的技術也可以把各漢語 10/27 06:04
saram: 獨立起來成為一種線上翻譯(或交互譯)的語言.因為我發現 10/27 06:06
saram: 西班牙有三種語言.而中文只有簡體繁體分別兩種,譯文還一樣 10/27 06:08
saram: 能不能多個"台語(文)"?譬如打入台語字(假設是漢字或拼音字 10/27 06:10
saram: )會機器會播出正確語音與其相應翻譯文字(中文或英文..) 10/27 06:11
saram: 我想已經有人著手在建立翻譯資料庫了.讓年輕人來吧. 10/27 06:12
saram: 語音輸入實在比文字輸入更容易. 10/27 06:15
saram: 聲音可以不分年齡的輸入(只要口齒清楚). 10/27 06:16
CCY0927: 敢問你近年來看過哪幾篇機器翻譯、語音辨識、語音合成相 10/27 08:31
CCY0927: 關論文? 10/27 08:31
MilchFlasche: 隨便用用線上翻譯引擎,把些大家現在都曉得的事情 10/27 10:01
MilchFlasche: 講成自己的新知,自我感覺良好的一天又過去了 10/27 10:05
saram: 你們認為要製造電腦技術的人才能上網談完電腦的感想? 10/29 22:19
saram: 還只是看討厭的人就刁幾句,即便他說的也沒錯? 10/29 22:20
saram: 不如把你對語音軟體發展的看法也說一些幫助大家. 10/29 22:21
saram: 為什麼要看過相關的技術論文才能討論應用與寄望? 10/29 22:23
saram: 消費者只是消費,消費者要下去寫程式嗎? 10/29 22:24
MilchFlasche: 你錯了,我不是刁討厭的人,是刁自以為很厲害的人 10/29 22:39
MilchFlasche: 是刁馬齒徒長卻沒料的人,是刁常常被糾正又不改的人 10/29 22:40
MilchFlasche: 我看不慣有人把大家都曉得的事情說成自己很有資歷 10/29 22:41
MilchFlasche: 我看不慣公共言論空間有不準確的資訊或是看似講得頭 10/29 22:44
MilchFlasche: 頭是道試圖建立言論地位但實際上反而造成公害的人 10/29 22:45
MilchFlasche: 因為這些都有誤導後人之虞、須耗費眾人成本闢謠澄清 10/29 22:46
MilchFlasche: 如此而已!懂幾分就說幾分,十幾年了一樣是個肉跤 10/29 22:48
MilchFlasche: 的人拜託不要表現得好像自己打過什麼美好的仗 10/29 22:48
saram: 到底要不要說說語音輸入的話題? 10/30 00:57
MilchFlasche: 你說的根本沒有什麼問題,就是大家都知道的, 10/30 09:12
MilchFlasche: 各大廠商尚未開發這個語種的翻譯模組 10/30 09:12
MilchFlasche: 現在就只有TTS、聽打、Meta公司的口譯這幾項有實做 10/30 09:13
MilchFlasche: 缺這麼多年還需要你講喔?這根本不是可討論的「問題 10/30 09:13
MilchFlasche: 「語音比打字方便」你是從1990年代就一直想到現在了 10/30 09:14
MilchFlasche: 對吧?這是什麼值得談的發現或創見嗎?實在。 10/30 09:14
MilchFlasche: 人家嘲諷你一句不懂裝懂你還真以為自己是什麼專家喔 10/30 09:19
MilchFlasche: 跟懂太少人講話實在很累,就像跟小朋友一樣需要耐心 10/30 09:19