推 lianpig5566: 語音辨識也是會串語言模型阿203.73.209.179 05/05 00:28
我大學做語音辨識的時候 llm 還沒有那麼流行
所以想說 應該不用動用到大模型就可以做
→ lianpig5566: 但現在大眾說的AI多半是LLM啦203.73.209.179 05/05 00:29
※ 編輯: joshddd (118.232.61.59 臺灣), 05/05/2026 00:30:52
推 Supasizeit: 你大學是不是連transformer 都沒出來203.204.195.174 05/05 00:35
是
推 stlinman: AI不只一種150.116.129.113 05/05 00:37
→ cloud3455: 現在的語音辨識如果混雜音或不夠清楚又203.121.254.197 05/05 00:38
→ cloud3455: 或發語人含魯蛋,辨識度只能說慘203.121.254.197 05/05 00:39
→ yunf: 你既然是學這個人,你怎麼會不知道?49.216.52.85 05/05 00:44
後來沒走語音辨識啊
那時候做專題玩玩而已
※ 編輯: joshddd (118.232.61.59 臺灣), 05/05/2026 00:46:08
→ yunf: 重點就是ai只是個籠統的名詞 後面如果要接到 49.216.52.85 05/05 00:46
→ yunf: 資料中心就是權限被人監管 49.216.52.85 05/05 00:46
→ yunf: 如果你整個國家的運作 沒有得到資料中心的許 49.216.52.85 05/05 00:49
訓練完的模型 就是參數喔
你可以想成就是一堆數字而已
你有足夠好的設備 其實本地就可以跑
不需要連線到機房
→ yunf: 可就整個停擺 這樣行嗎? 49.216.52.85 05/05 00:49
※ 編輯: joshddd (118.232.61.59 臺灣), 05/05/2026 00:51:33
→ yunf: 他們不會讓這件事發生 49.216.52.85 05/05 01:01
→ yunf: 他投資這麼多,就只想要做一件事 讓資本產生 49.216.52.85 05/05 01:01
→ yunf: 強制力 49.216.52.85 05/05 01:01
→ Busufu: 老哥你畢業太久了 223.137.78.205 05/05 01:40
推 sali921: 人工智慧,人工大腦,功能跟人腦一樣等 114.33.43.42 05/05 02:43
→ sali921: 級 114.33.43.42 05/05 02:43
推 TameFoxx: 將音訊token化,與文字一起丟進去訓練 182.233.84.193 05/05 03:00
→ TameFoxx: 效果會比傳統的好 182.233.84.193 05/05 03:01
→ TameFoxx: 因為音訊不清楚無法辨認的時候 182.233.84.193 05/05 03:02
→ TameFoxx: 他可以用語意去推測 182.233.84.193 05/05 03:02
→ TameFoxx: 在辨識前,你也可以先用文字跟他概要這 182.233.84.193 05/05 03:03
→ TameFoxx: 是一個什麼情境的音訊 182.233.84.193 05/05 03:03
→ TameFoxx: 概念跟LLM做影像辨識一樣 182.233.84.193 05/05 03:04
→ yesonline: 老哥你用的是傳統機器學習. 有點過時了 220.133.253.85 05/05 04:07