精華區beta C_Chat 關於我們 聯絡資訊
※ 引述《sai0224sai (塞啦)》之銘言 : 看中國那邊都在用游戲、手游 : 沒看過遊這個字出現 : 是真的沒有"遊"還是單純跟臺灣的"因該"一樣變成年輕人分不清的地方? 說到簡轉繁,我搞不懂機器翻譯為什麼永遠搞不定常用的繁體字 舉例: 遊戲→游戲、什麼→什么、豆干→豆幹 一個→壹個、一隻→一只 不該翻的亂翻,該翻的又不翻 現在AI文字處理不是在吹可以辨識情緒、寫詩、寫新聞 結果這麼簡單的簡轉繁反而做不到= = 不過好處是跳板仔一下子就露餡了: p ---- Sent from BePTT on my Google Pixel 4a (5G) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 106.105.237.50 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1630927678.A.1D7.html
jokerpok: 你說的對 老鐵09/06 19:28
xkiller1900: 樓上你這也學得不像XD09/06 19:30
Hecarim: 繁體用的人口少 AI訓練不足09/06 19:30
john0421: 分辨方法是單一字 還是兩字以上呢09/06 19:30
Hecarim: 就別挑剔了 google翻譯其他語言已經很神==09/06 19:31
a031405: 沒毛病啊!09/06 19:32
john0421: 單一字會發生發->髮 兩字的話除了輸入詞要夠多還有其他09/06 19:32
angdafa: 這些東西有時候真的可以分辨哪些是裝繁體使用者的支那人09/06 19:33
e49523: 麵 面09/06 19:34
chister: 這是低級程式 這些詞正常程式都能辨別 比如word09/06 19:34
HarunoYukino: 也有裝簡體的1…09/06 19:34
chister: 但太聰明的程式有時也會失誤 比如說高達八成變鋼彈八成09/06 19:35
HarunoYukino: 也有裝簡體使用者的1…09/06 19:35
P2: 奔馳 賓士09/06 19:35
emptie: 現在的ai很強不代表你手上的那個ai很強09/06 19:36
john0421: 看小說一堆禁止 八成都是->八CD是 明明不是那個成都09/06 19:36
NDSL: 數據顯示鋼彈八成09/06 19:36
emptie: 但要做到完美轉換一定需要語意分析,不然上面那個鋼彈-高09/06 19:37
emptie: 達的永遠搞不定09/06 19:37
bc0121: 沒辦法,哥布林的言語邏輯不是AI能輕易理解的東西09/06 19:37
energyy1104: 因為支那大量輸出支語啊 繁體怎麼可能洗得贏09/06 19:38
energyy1104: AI就是看數量決定的09/06 19:38
john0421: 為了成功轉換要輸入 一二三到十成都是 會增加多少詞呢09/06 19:38
jim12441: 我看你是沒遇過計程車兵喔09/06 19:39
OldYuanshen: 就算現在的AI可以自己從零開始構思一部小說作品09/06 19:39
OldYuanshen: 不代表google要拿這種等級的AI幫你簡轉繁吧==09/06 19:40
googlexxxx: https://reurl.cc/V5pQkQ09/06 19:40
googlexxxx: AI 的原因…目前微軟還在改共用內碼中09/06 19:41
energyy1104: 你想想70億人口只有2300萬人需要簡轉繁 再來想為什09/06 19:41
energyy1104: 麼google不幫你改善吧09/06 19:41
googlexxxx: 我之前曾經改過一段語法,猜中國的編碼猜四次猜台灣的09/06 19:42
googlexxxx: 編碼猜三次09/06 19:42
googlexxxx: 寫一次跨國論文其實也可以09/06 19:42
googlexxxx: 以後輸入法應該也剩拼字跟注音,其他的輸入法會越來越09/06 19:44
googlexxxx: 少09/06 19:44
aegisWIsL: 別說程式了,現在年輕人也打不出什麼,都打“甚麼”09/06 19:45
Ricestone: 甚麼本來就對啊...09/06 19:47
gxu66: 因為台灣什真的念ㄕㄜˊ 的也很少吧 通常都聽到ㄕㄣˇ麼09/06 19:48
gxu66: 以前要動筆寫作文 偷懶一定是寫什09/06 19:48
xkiller1900: 什/甚,不是都對ㄇ09/06 19:49
jerryh612: 甚麼 應該是微軟輸入法搞的...微軟輸入法也很爛就是了09/06 19:50
purewind: 甚麼應該是微軟的錯,微軟內建打ㄕㄣˊ不會出現什,go09/06 19:50
purewind: ogle就可以09/06 19:50
Hecarim: 神麼09/06 19:51
googlexxxx: 繁簡轉換就是把現有的編碼去轉成預估的編碼,對面一的09/06 19:51
googlexxxx: 記憶體位址對應繁體的就是壹這不難懂09/06 19:51
kaj1983: 神馬啦09/06 19:52
googlexxxx: 微軟編碼跟google編碼又完全不同,寫程式的應該就知道09/06 19:52
googlexxxx: 了09/06 19:52
soem: MDN最近有人提議合併zh全部文件再用工具轉換,滿滿反對意見09/06 19:52
SangoGO: 簡繁經典笑話:我下麵給你吃09/06 19:53
timez422: word 的繁轉簡還會把番茄翻成西紅柿==09/06 19:56
googlexxxx: 53樓那個是翻成英文tomato再翻成簡體XD09/06 19:57
GTOyoko5566: MOD翻譯簡轉繁那個面麵...09/06 19:57
Hecarim: soem那個連結某些樓被瘋狂倒讚 笑死09/06 20:00
googlexxxx: 翻成英文再轉成其他語言在多國的正確率會高一點,不過09/06 20:00
googlexxxx: 就變成netflix中文說自己的,字母演自己的09/06 20:00
a62511: 干乾幹 么麼嗎 有夠煩09/06 20:00
googlexxxx: 翻成英文好處是英文會矯正文法跟意思,中文簡體轉繁體09/06 20:01
googlexxxx: 沒有這功能09/06 20:01
emptie: 要也可以 但沒需求不太能期待開發者花時間在這09/06 20:04
henryyeh5566: 為什麼要下功夫弄簡轉繁?中國人就是希望你台灣也09/06 20:05
henryyeh5566: 跟著使用最正統的殘體中文啊09/06 20:05
mattc123456c: 後、后傻傻分不清楚09/06 20:05
gxu66: 會按簡轉繁其實也就是想讀起來比較快而已 不是真的看不懂09/06 20:06
gxu66: 誰要花心思去弄這個...09/06 20:07
ClannadGood: 奔馳 賓士09/06 20:07
ClannadGood: 之前看網路小說不懂為啥會有啥賓士 後來才知道09/06 20:08
RoChing: 我一直很好奇,他們真的分得清楚后宮的后跟后妃沒關係嗎09/06 20:08
ClannadGood: 還有高達會變成鋼彈= =09/06 20:08
gxu66: 而且真的弄了像 賓士>奔馳這種 翻譯錯誤率搞不好又會更高09/06 20:09
gxu66: 到最後感不好比沒轉換還難讀09/06 20:09
ToTo0306: 我覺得留這些bug抓跳板仔蠻好用的啊www09/06 20:10
googlexxxx: 賓士、奔馳這問題是潤化的時候用的台灣還是賓士中國還09/06 20:11
googlexxxx: 是奔馳這兩個不可能變09/06 20:11
spfy: 以前有個26粉紅愛國同事 想了很久跟我說09/06 20:11
spfy: 說真心話 我覺得鋼彈翻的比高達厲害多了09/06 20:11
a75091500: 繁化姬09/06 20:11
soem: 有時轉了才會看不懂呢,我就分不出手機相關討論的內存到底是09/06 20:12
soem: 「內部儲存空間」還是「記憶體」09/06 20:12
mahimahi: 老實說簡繁還是有必要的 有些簡體連使用的字詞都不一樣09/06 20:14
mahimahi: 了根本看不懂09/06 20:14
mahimahi: 繁體在地化的部分*09/06 20:15
googlexxxx: 你有沒有帶筆記本?(X09/06 20:21
googlexxxx: 你有沒有帶數碼化電子文字計算器(O09/06 20:21
GTOyoko5566: 而且也不用談什麼簡體中文了,現在他們那種夾雜英文09/06 20:22
GTOyoko5566: 的談話方式看了頭就痛09/06 20:22
googlexxxx: 數字化(X09/06 20:23
googlexxxx: 數位化(O09/06 20:23
googlexxxx: digital09/06 20:23
googlexxxx: Ultra notebook 輕薄型筆電(O 超級本(X09/06 20:29
GiantGG: 以前用過ConvertZ簡繁轉換軟體就可以分辨這些字詞,所以09/06 21:02
GiantGG: 要做也不是做不到09/06 21:02
ken12121984: 記憶體是閃存,很好分09/06 21:12
twosheep0603: 簡繁之間的轉換都會遇到一對多的情況09/06 21:28
j68345517: 天幹地支、 於禁09/06 21:30
tt8otw: 高達 鋼彈09/06 21:46
john5568: 你舉例的前後可不可以統一一下..一下前面繁體,一下簡體09/06 22:19
正確→錯誤 而不是 繁體→簡體,你誤會了
nisioisin: 這些常用詞語用詞庫就解決8成了09/06 22:38
nisioisin: N年前的ConvertZ就做得到09/06 22:38
nisioisin: 只是很多人/公司?用的軟體廢到而已09/06 22:38
HowardLangou: 這就是文化侵略阿09/06 23:20
googlexxxx: 也不算侵略啦!我們很多用詞對方也拿去用了,還蠻有趣09/06 23:28
googlexxxx: 的。例如筆記本跟筆電筆電現在比較常見了09/06 23:28
allen11513: 詞這種東西就是好用就拿來用,講文化侵略還不到啦09/06 23:30
hayate65536: 我都用同文堂把預設詞彙關閉,然後自己慢慢編資料庫09/07 02:58
hayate65536: 編的資料庫內容越嚴謹越龐大,要完全正確翻譯不是夢09/07 02:59
hayate65536: ,不過我寫到死應該都寫不完09/07 02:59
※ 編輯: purewind (106.105.237.50 臺灣), 09/07/2021 10:39:18