推 gogorice: 真的很難回本…111.71.72.140 01/01 15:55
噓 tpkgo: 急什麼 等蒸餾完就不用佔那麼大了 218.164.77.3 01/01 15:56
推 lianpig5566: deepseek不就是在減少吃的資源量? 211.22.230.229 01/01 16:01
deepseek量化後胡言亂語非常嚴重,不知道是不是跟這種訓練模式有關係
※ 編輯: givemoney (42.77.78.21 臺灣), 01/01/2026 16:07:47
→ adios881: TPU162.120.248.102 01/01 16:23
→ adios881: Twitter有一篇發文是說GPT的電力成本162.120.248.102 01/01 16:32
→ adios881: 和2008年的GoogleSearch一樣多162.120.248.102 01/01 16:32
→ adios881: 雖然在Reddit引起正反討論162.120.248.102 01/01 16:32
→ adios881: 只是趨勢就是大公司用AI成本會下降162.120.248.102 01/01 16:32
推 andy79323: 公認蒸餾最好的Qwn3 deepseek R1223.138.142.193 01/01 17:00
→ andy79323: 很難用223.138.142.193 01/01 17:00
→ stanwu: 矩陣向量用swap應該會像286電腦render動畫 118.232.100.55 01/01 17:24