作者saltlake (SaltLake)
看板Math
標題語言之間的轉換
時間Sun Jun 7 10:32:26 2020
: → saltlake : 學法文、德文和俄文的時候,有甚麼變換規則讓人 06/06 05:50
: → saltlake : 學會一種語言之後很快透過那個變換去掌握另一種? 06/06 05:51
: → saltlake : 畢竟我們可以把語言看成描述物體的座標系,相同物體 06/06 05:52
: → saltlake : 在不同語言的表達式,是該物體在不同座標系的座標 06/06 05:53
: → saltlake : 那麼不同座標系(語言)之間是否渴求出它的變換關係? 06/06 05:53
: 推 chemmachine : 樓上,現在google已經做得很好了。它語系轉換接近百 06/06 09:02
: → chemmachine : 國語言,而且似乎轉換似乎像機器學習一樣輸入資料庫 06/06 09:03
: 推 chemmachine : 之前看過開發語言演算法之一的文章,方法之一是用 06/06 09:06
: → chemmachine : 某種演算法,也跟機率有點關係。然後它會一直輸入 06/06 09:06
: → chemmachine : 文件讓程式去比對學習,然後超多各國的超高薪工程 06/06 09:07
: → chemmachine : 師支持更新它 06/06 09:07
: 推 chemmachine : 上次用到youtube影片它英語字幕可以自由轉換7-8國字 06/06 09:10
: → chemmachine : 幕讓我很驚訝。而且我看一下語義還差不多 06/06 09:10
: → chemmachine : 然後我查英文單字還會發現它跑到法文或西班牙文 06/06 09:12
: → chemmachine : 可見它原來的發源國是英文吸納其他國生字 06/06 09:12
: 推 chemmachine : 而且它是實作的,不是打高空理論嘴砲。 06/06 09:28
: 推 chemmachine : 可見語言翻譯可以用數學原理去逼近近似解決,印證 06/06 09:36
: → chemmachine : 萬物皆數 06/06 09:36
: 推 chemmachine : 網路上的文章都能直接google翻了,不管語系。pdf 06/06 15:32
: → chemmachine : 能複製文字的話就也能複製出來翻譯,沒有的話用文字 06/06 15:32
: → chemmachine : 識別軟體能讀出來,再用google翻,也能翻出一百種 06/06 15:34
: → chemmachine : 種語言八大概。 06/06 15:35
: 推 chemmachine : google大概是唯一成功快速搜尋、全世界網路地圖、 06/06 15:38
: → chemmachine : 成功全世界語言翻譯的公司。 06/06 15:38
: 推 Vulpix : 使用者資料。不過安全搜索等功能很惱人,前一陣子連 06/06 17:04
: → Vulpix : 搜尋pixiv都擋,不知道在擋什麼。 06/06 17:04
為了讓問題內容與標題一致,另外開一篇文章來討論。
就上面所述,將人類不同語言之間做轉換的「函數」應該是存在的。但是
這種函數的唯一性呢? 例如英文和中文之間的轉換函數是否是唯一的。如果
是非唯一的,我們能否定義某種最佳的函數? 該如何定義?
另外,考慮到上述用以轉換的函數似乎以所謂的深度學習演算法來實現,
那麼我們評價不同演算法的效能除了根據解問題所耗時間與硬體資源以外,
還有甚麼測度(Metric)方式嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.44.197.114 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Math/M.1591497148.A.186.html
推 kittor : 我倒是想法語或格陵蘭語來教工數看看 06/07 11:33
→ kittor : 想用 06/07 11:34
→ thinkabout : 我個人認為"函數"是不存在的,中文的加油無法用英文 06/07 11:51
→ thinkabout : 恰當的表示,若是要用勉強能翻譯的語意,會變成一對 06/07 11:51
→ thinkabout : 多的對應 06/07 11:52
即使「函數」不存在,那有何替代的數學「物件」可用上?
畢竟不談當前的機器學習,異語言翻譯這件事存在更加久遠。那麼數學要處理
這個問題總是要先定義出某些處理的工具出來。
※ 編輯: saltlake (114.44.197.114 臺灣), 06/07/2020 15:18:06
推 chemmachine : 唯一性沒有,我在八卦版之前看到 06/08 00:09
→ chemmachine : 很多語言翻譯演算法連結超多,網路也一堆。 06/08 00:09
→ chemmachine : 它們是討論google的壟斷性,應該都是碼農,非唬爛 06/08 00:11
→ chemmachine : 文 06/08 00:11
→ chemmachine : 一對多,多對一不是問題,那叫轉注假借。 06/08 00:12
推 chemmachine : 最佳函數應該不知道,你知道應該可以當首席google 06/08 00:13
→ chemmachine : 首席翻譯部門工程師。 06/08 00:13
推 chemmachine : metric就大o 小o 吧。 06/08 01:16
推 chemmachine : 那個"函數"[math]改成“關係“”【math】就好。 06/08 02:54
→ chemmachine : 用機率算argmax,看一下澳洲那句 06/08 17:43
推 chemmachine : 澳洲是少數與北韓建交的國家之一。 06/08 17:45
→ chemmachine : Google Translate 部門主管Franz Josef Och 06/08 17:45
推 chemmachine : franz在機器學習比賽得了大獎被google聘用 06/08 17:48