看板 Gossiping 關於我們 聯絡資訊
如題 剛剛看到 阿里巴巴發布新的32B模型 QwQ-32B 用32B的參數 效果跟DeepSeek-R1的671B差不多 https://i.imgur.com/2Za5wME.png 成本是DeepSeek-R1的十分之一 https://i.imgur.com/UrF1Gy7.png 這個大小 直接用消費級顯卡來跑速度都能用了 未來跑訓練和使用LLM的成本會大幅降低 對先進製程的需求也不再急切 然後現在又送給美國 唉 GG 台GG -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.134.21.189 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1741315385.A.4BF.html
nerorush: 我只信八卦AI半導體專家 27.52.98.207 03/07 10:45
dayend: DM 傳輸有先天缺陷大漏洞 103.59.108.132 03/07 10:47
aza0290: 支那擅長削減成本 114.44.137.39 03/07 10:47
dayend: 用最寬鬆的測試器也解決不了 很難救 103.59.108.132 03/07 10:48
shampoopoo: QwQ 67.250.195.107 03/07 10:53
freeunixer: 你要有 24g VRAM 的顯卡啊...118.163.122.193 03/07 10:54
kotorichan: 人家是要做AGI欸 算力需求無限啦 42.71.251.183 03/07 10:55
gg86300: 阿巴阿巴QwQ 101.8.48.191 03/07 11:02
widec: 阿里巴巴有32b了喔 之前用只有16b 118.232.6.177 03/07 11:14
observer0117: quantize後用16G顯卡跑起來效能不錯 220.132.247.29 03/07 11:15
observer0117: 其實還是差了一點,但所需資源減少 220.132.247.29 03/07 11:15
observer0117: 很多,對一般人來說實用性比較高 220.132.247.29 03/07 11:16
gino0717: QwQ 114.36.5.195 03/07 11:19
qdto: 有大神說明嗎 還是看股價最準? 101.8.48.198 03/07 13:29