→ newwu: 看訓練樣本有沒有用台灣話吧 不知道他們樣本都哪來的 10/20 08:40
推 Vulpix: 看推文,團隊有臺灣人。應該會用到。 10/20 08:41
→ newwu: 訓練資料中常見的外來語對模型來說就是hokkien 詞彙的一部 10/20 08:44
→ newwu: 分 模型不會因為外來語就不學吧 10/20 08:44
推 marchcharlie: 有傳言說有拿八點檔來練 但不知真假 10/20 09:45
推 youzen1226: 拿八點檔來練的話應該會蠻多元的XD 10/20 10:34
推 robertchun: 有台語電視劇應該就八點檔,還有台灣各地腔的語料庫 10/20 10:55
→ robertchun: 加上中國閩南那邊的 我在討論串前一篇有整理 10/20 10:57
推 Lb1916: 你的整理感覺像是台灣為主, 10/20 12:05
→ Lb1916: 漳州、泉州、廈門等為次, 10/20 12:05
→ Lb1916: 至於東南亞新馬地區好像沒有看到。 10/20 12:05
推 b852258: 台語有好多是直接用日語代替,或者很多專有名詞沒有對應 10/20 12:29
→ b852258: 的說法,不知道那個要怎麼解決 10/20 12:29
推 Slzreo1726: 這個問題就跟同一意思對應到不同詞是一樣的概念 比如 10/20 14:49
→ Slzreo1726: 台灣人說水準 等於對岸說水平 翻譯如果連這樣的差異 10/20 14:49
→ Slzreo1726: 都分辨不出來 那就是個爛翻譯而已 10/20 14:49
→ Slzreo1726: 台灣閩南語中一些來自日語等外來語在其他分支的閩南 10/20 14:51
→ Slzreo1726: 語也必定會有相同意思的詞去描述 10/20 14:51
推 mattc123456c: 金門好像對摩托車叫「摩刀掐」吧? 10/20 15:15
→ mattc123456c: 而台灣就受日本影響用「oo-t′oo-b′ai」 10/20 15:17
→ longlongint: 普利珠 能翻成 motorcycle pulley 嗎(誤 10/20 18:33
→ bluejark: 我看這研究對外是寫福建話但前面那算研究員自己用台灣的 10/20 18:56