看板 Soft_Job 關於我們 聯絡資訊
最近假日有空常常在調戲 iPad 的 Siri, 但用到一半, 就很感嘆台灣人為什麼只能用中國話, 而不能用台灣人自己的語言作語音助手? (當然我知道 siri 會幾句台語, 但是那根本不叫"會". 客語原語根本就不用想了.) 上網查了一下, 好像還沒有人作相關計畫. 政府最近不是要花錢補助 AI? 是否應該分出一部份的錢, 補助廠商在台灣聘請相關人員研發相關技術? 好處有三: 1. 研發的主體性 若是研究中文或英文等主要語言辯識, 台灣因為走的太慢, 必然是研發中心的邊緣, 特別是外商不會把研發的主體放在台灣. 若是以台灣語種作為研發中心, 則最核心的部門都會在台灣(就算受補助的是外商), 在台灣的研究人員可以作為整個研究的主體, 且永遠不會被邊緣化. 且這些研究結果, 除了台客語在中國數省及東南亞有大量應用外. 原語因為與南島各語有關連性, 在現在南島多數語言尚未有語音助手的情況下, 台灣研究人員先作下去, 是否就可以搶占一部份先機? 2. 政治的主體性 這就不用說了, 語言越分離, 則雙方心理上分離的傾向越大. 這也是中國政府這十幾年傾力消滅漢語方言及少民語言的原因. 3. 文化的延續性 我真的不希望, 十幾二十年後電腦多數用語音操作時, 仍然只能用中文. 真的很可悲. 在這樣環境成長的下一代, 縱使會說一部份台灣語言, 對台灣各語的想法可能就和古文和拉丁文差不多了吧? 這樣台灣的文化是不是亡了呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.194.159.170 ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1522509694.A.C0D.html
rabido: 這就是必然的一種消長吧 03/31 23:28
希伯來文還從死語復活呢. 且這也是替台灣自然語言處理人員取得研發主體性的機會.
heguagua: 市場不夠大,要投入的資源不符成本 03/31 23:45
所以政府要補助啊.
femlro: 政府規定的官方語言是北京漢語 什麼時候是台語了 嚴格來說 04/01 00:32
femlro: 那也不是台語 是福建一帶的話 去福建一堆人都在講河洛話 04/01 00:32
femlro: 要siri學地方方言 大陸有多少方言要入列啊 04/01 00:32
1. 台語比褔建話一詞更早被人說. 而且褔建也不是只有河洛話. 2. 中國要不要做相關研究干台灣人屁事, 台灣先做搞不好還佔先機. 因為現在中國法西斯不會讓褔建&客家搞漢語分化 (連siri粵語中國人都有不爽的) 等到他們過幾十年想撿回來時, 台灣就是這些地方的精神祖宗了.
a87569650: 事實就是不是全台灣人都說閩南語 04/01 00:34
我有說只做河洛話嗎? 滿腦子獨尊中國話卻連中文也看不懂? ※ 編輯: GenghisKhan (123.194.159.170), 04/01/2018 00:46:20
joshua5201: 很有理想 很好 不過蘋果公司不是慈善企業 04/01 00:45
rupcj8: 聽說蘋果之前有找做台語語音處理的人 04/01 00:45
joshua5201: 不管是不是官方語言 夠多人說他一定做 04/01 00:46
所以我說這次政府AI補助可以走這個方向啊. = = 麻煩看一下全文吧. ※ 編輯: GenghisKhan (123.194.159.170), 04/01/2018 00:47:31
CaptainH: 讓你更崩潰的事實是:科大訊飛的閩南語辨識已經領先了 04/01 00:53
CaptainH: 市場輸人 技術也輸人 不要以為自己文化有多大吸引力 04/01 00:54
科大最近才剛來台灣找金融等業的合作機會. 我是不知道他們有在搞這些, 但是連中國這種獨尊中文的環境人家都在搞, 台灣人難道不能作? 另外鄭重說明, 台灣文化外國人有多大吸引力我管不著, 若台灣人不想尊重本國文化, 可以選擇不要在台灣. ※ 編輯: GenghisKhan (123.194.159.170), 04/01/2018 01:12:31
s0912309: 為什麼說台語就是台灣文化啊? 04/01 01:16
CaptainH: 科大本來就在做中國各地方言了,閩南語當然是其中之一 04/01 01:18
CaptainH: 你好像以為做一個大規模商用的語音辨識很容易 XDD 04/01 01:19
就是不容易, 不然我幹麻不直接捐錢給研究室做一個. 因為不容易, 所以希望政府這次AI出錢的計畫能放一些有意義的東西上面. ※ 編輯: GenghisKhan (123.194.159.170), 04/01/2018 01:23:17
CaptainH: 做不出來的原因就是:講台語的人1)太窮 做完也沒價值 2) 04/01 01:22
CaptainH: 太廢 收不到資料 做不出研究 04/01 01:22
CaptainH: 不是你"想不想"或"難道不行"的問題 04/01 01:22
CaptainH: 但文化內涵又不足以吸引外國人來做 就這樣 04/01 01:25
CaptainH: 而且保存文化也應該是鼓勵學習和創作 建個模型要幹嘛XDD 04/01 01:27
CaptainH: 你以為政府都沒補助台語ASR的計畫?多了去了,為什麼你 04/01 01:29
CaptainH: 都一無所知 想過原因嗎 04/01 01:29
台語asr的部份可以舉幾個過去案例嗎? 打算了解其過去失敗原因. ※ 編輯: GenghisKhan (123.194.159.170), 04/01/2018 01:32:14
b29308188: data有點少有點難學耶 光是找一個大corpus學embedding 04/01 01:35
b29308188: 就不知道哪裡找 遍還要可以index的concept數量可能也不 04/01 01:35
b29308188: 多 04/01 01:35
CaptainH: 因為沒有需求 業界沒有動機投入太多心力 開發能量只有幾 04/01 01:39
CaptainH: 間大學和中研院的語音lab 真的有戰力的教授可能不到十 04/01 01:40
CaptainH: 個… 04/01 01:40
CaptainH: 而且成果質量最多是發paper 其實不足以商用 往往是技轉 04/01 01:42
CaptainH: 之後就沒下文了 從沒在市場上出現 04/01 01:42
Sieg2010: 你把原住民話放在哪?應該先做原住民話吧? 04/01 01:45
CaptainH: 這樣算失敗嗎 不算吧 只是不合你那無謂自卑和莫名自大 04/01 01:52
CaptainH: 的世界觀而已 04/01 01:52
elements: 用的人太少 而且大多數人講台語的國語都講得很好 不如 04/01 02:24
elements: 去識別大陸內陸口音 那國語才是沒人聽得懂而且人口眾多 04/01 02:24
liaon98: 臺語 客語 原住民各語 之前已經被立法列入國語了 04/01 02:49
Agde: 歐洲很多國家如冰島、立陶宛、拉脫維亞等等,它們的官方語 04/01 04:10
Agde: 言都沒被 Siri 收錄。 04/01 04:10
Agde: 覺得這篇很像在反串 = = 04/01 04:10
Colossus: 台語其實是中國方言的閔南語好嗎 04/01 06:43
testPtt: 因為拿了錢就要做出來 對於沒標準的語言很難做 04/01 07:49
oas: 本末倒置吧?! 要延續文化至少要從教育為"主體"開始 Siri???!! 04/01 08:04
oas: 到時光為那個語言要代表台灣 去花納稅錢 應該就吵翻天惹~~ 04/01 08:06
oas: 出發點是好的 但理由跟現實執行面差太多~ 04/01 08:11
oas: 當然如果能有長輩熟悉的語言的語音助理是非常好! 04/01 08:12
robler: 無聊 沒人用的語言消失很正常 04/01 08:21
phisixersai: 笑死人 一堆文盲完全無視原Po內文也有寫到原住民語 04/01 08:35
phisixersai: 跟客語 拼命拿台語出來鞭 04/01 08:35
shenevol: 把軟體做到好要花很多錢 重點是做出來要幹嘛呢 有什麼 04/01 09:47
shenevol: 商業應用呢 04/01 09:47
panpan: 哈 這版都北部人居多 鞭台語會意外嗎 04/01 09:48
shenevol: 沒有錢當成強烈的上線動力 就算有了這個project 可能也 04/01 09:48
shenevol: 會做不完或是做不好 04/01 09:48
shenevol: 發現前面C大已經把我想的講出來啦… 04/01 09:50
K60258: 你怎不出錢做呀 04/01 10:00
dsilver: 其實工研院比科大訊飛還早出現,大概2009就看到他們放台 04/01 10:20
dsilver: 語tts在網頁端了,但是人家科大訊飛都跑那麼前面了… 04/01 10:20
dsilver: 還有一個問題是語音轉文字和文字辨識問題,到底要以哪一 04/01 10:22
dsilver: 種文字為標準?中國習慣用字?鄉民習慣用字?教育部那種 04/01 10:22
dsilver: 沒人看得懂的用字?這其實很難,不像廣東話那樣有統一標 04/01 10:22
dsilver: 準用字 04/01 10:22
b81314: 這篇的價值 04/01 10:32
Murasaki0110: 沒有需求 沒有利益 沒有data 04/01 10:32
Csongs: 支持,台語是個文化特色 04/01 10:41
alihue: 沒需求,沒市場的東西就留給開源自high就好了 04/01 11:19
s860134: 沒人作不會自己作 整天只想著天上掉下來 04/01 11:27
s860134: 你嘴巴裡面的研究人員就是沒有包含你自己ZZZZZZZZZ 04/01 11:29
qlinyuhn: 噓文水準不敢領教 04/01 11:35
KernelChen: 推文水準不敢領教 04/01 11:38
y3k: 我記得工研院的TTS是免費使用的 你可以先做一個APP試試水溫 04/01 11:49
EGsux: 資料收集整理就不知道要花多少了 04/01 12:02
jimmy689: Google是做產品的,不是做政治正確玩具的,做個方言TTS 04/01 12:10
jimmy689: 市場有多大? 04/01 12:10
leveger0903: 科技公司還是賺錢導向 補貼我持反對 政府應該把財政 04/01 13:06
leveger0903: 用在更需要的事物上 04/01 13:06
shiauji: 就市場小,光是繁體中文的siri就難用死了 04/01 13:17
jyunwei: 你要補貼的應該是台灣相關語言的教育及資源完備,整個起 04/01 13:23
jyunwei: 來了之後這種東西自然會有人做 04/01 13:23
TAKADO: 方言用戶太少=沒市場 商用實用化很難大公司沒人會做吧 04/01 13:26
TAKADO: 況且台語/閩南語分支超多 要用哪個地區的為主都是問題 04/01 13:27
TAKADO: 光是台灣簡單的一句 "洗"菜 "煮"飯 就有多少講法了 04/01 13:27
PUTOUCHANG: 認同 請政府大力砸錢 像離岸風力一樣 我先佈局 04/01 13:43
sharku: 別鬧了 04/01 14:42
codotsun: 資料謝謝 哪裡來台語corpus?????? 04/01 15:36
mathbookh2o2: 台灣很多人做事之前都會先想好100個做不到的理由 04/01 15:40
atpx: 我會是不贊成做的其中一個. 理由無它, 資源有限, 要補助也要 04/01 15:45
atpx: 是補助能幫助台灣在AI技術某些領域領先並且能商業化 04/01 15:46
atpx: 你說的偏個人情感與政治傾向, 可以自己出錢做, 但不適合用 04/01 15:46
atpx: 公眾資源 04/01 15:47
hegemon: 你知道閩南語很多地方的語調都不同嗎? 滾回八卦板取暖比 04/01 15:47
hegemon: 較實在 04/01 15:47
atpx: 補助能夠商業化的技術重點在於, 它才有帶動後續投資的效益 04/01 15:48
atpx: 以及不會因為沒有市場而錢灑完就無以為繼 04/01 15:48
k300plus: 有反面意見你就開嗆 情緒管理也太差XDD 04/01 17:51
wildli0422: 蚊子館,蚊子語音助理 04/01 18:22
SmallpTsai: 推 atpx大 的意見 04/01 20:09
Eric0605: 就算台語腔調都有很多種 這樣要做哪一個 04/01 20:45
Eric0605: 而且現在中文 英文也不是說就做多好了 04/01 20:46
Eric0605: 還有很多要改善的 04/01 20:46
Eric0605: 另外如前面說的 根本沒市場 正負要補助的東西還要很多 04/01 20:47
poc7667: 你自己都不尊重你自己國家的人了 滿腦熱血文青qq 有夢最 04/01 23:44
poc7667: 美 加油 04/01 23:44
sammui: http://bit.ly/2Ij8CMI 雅婷一號開始學台灣人的語言習慣了 04/02 00:54
jinmin88: 台灣就一堆文青在喊主體/文化/環保/反核讓台灣一直空轉 04/02 16:19
jinmin88: 拜託把心思放在國際都在競爭的議題上好咪 04/02 16:19
aszx4510: 中文都做不好了還要做台語 更何況根本沒語料 04/02 21:10
apley: 講白了就是台語只是政治正確的工具,根本沒有商業性。 不支 04/02 23:39
apley: 持就嗆滾出台灣,還真是沒新意,不如說滾回美國或日本喇~ 04/02 23:39
apley: 覺得只能說中文很可悲,那就用英文或日文啊? 幹嘛強迫自己 04/02 23:45
apley: 那麼可悲咧? 人家非洲墨人就沒在管那些,一直講母語用母語 04/02 23:47
apley: 因為他們沒有這些需求。 那你現在談的是商業產品,你講的三 04/02 23:48
apley: 件事情,對於商業化來說都是沒意義的東西。 未來世界一堆語 04/02 23:49
apley: 言會消失,只剩下英系、拉丁語、阿拉伯語、中文等語言,就 04/02 23:53
apley: 只是因為用的人口多。 台語不會消失,原因單純是因為它是中 04/02 23:54
apley: 文的方言之一而己。 沒人用的東西,就不會有人開發。 04/02 23:55
aszx4510: 同意樓上 就連學校的Lab也不太願意研究沒人關注的議題 04/02 23:59
aszx4510: 需要賺錢維持經營的公司 更不可能研究沒商業價值的事情 04/03 00:00
katzlee: 你可以去請中國福建省的主委補助你 04/06 08:19