看板 Gossiping 關於我們 聯絡資訊
論文有公布 現在就看各家機構要不要去做重複性的驗證 然後使用MOE的稀疏模型,成本一定很低 這無庸置疑 在專業領域一定表現的會比較好, (單一任務:寫程式、問數學等等) 但泛用型的就可能沒麼理想, 或許最後會發展出泛用型與專業型兩種。 不過也有新創的地方,例如他是訓練是靠自我學習自我解決問題, 這點蠻厲害的。 先不用去糾結有沒有言論審查,這肯定有, 我之前傳一些股票的券商報告, 都被用違反政策給阻止了。 這是比較可惜的。 5萬張H100的事情 目前只是傳聞 幻方絕對不敢講 而且這五萬張放在哪裡也令人覺得有趣 畢竟之前美國的管制禁令把新加坡列為Tier2 而新加坡竟然沒有唉唉叫... 感覺有貓膩啊 ※ 引述《koei5566 (光榮56)》之銘言: : deepseek賣點就是不堆算力 : 改進算法用少量算力做出很大的成果 : 不過有人說是唬爛的 : 財經網美說deepseek偷偷用了五萬顆H100 : 光這成本就幾千萬美金了 : 又偷偷用了中東那邊的算力 : 不可能像deepseek說的那樣只用了550萬鎂就開發出來 : 但是deepseek又開源支持本地運算 : 有張8GB顯卡 : 把deepseek環境架一架 : 斷網跑一下就知道算法是真是假 : 那請問哪邊的說法是真的? : 有沒有八卦?? -- 標題 [新聞] 每天愛愛3次 她在半年內狂瘦50公斤 看板 Gossiping 時間 Mon Oct 12 16:26:25 2015
kitune: 好胃口10/12 16:26
cake10414: 肥宅表示: 10/12 16:26
all0pha765: 難怪三樓那麼痴肥 因為沒做愛 10/12 16:27
all0pha765: 幹你老師10/12 16:27
-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 106.104.69.82 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1737961401.A.E06.html
yoyodiy: 我靠用chatGPT 進出股票賺快一倍了 這行? 125.231.79.148 01/27 15:04
jerrey: 礦場一堆。看yt介紹很可怕 114.34.175.127 01/27 15:07
yamhome: 別太早戳破中國假新聞,粉紅會不開心 42.73.121.34 01/27 15:07
yoshilin: 發表這麼久,mega應該內部有測過了101.139.235.218 01/27 15:07
tetani: 以色列也是tire2 很神奇218.173.194.112 01/27 15:10
l11111111: 先前V3版就已經引起歐美注意在分析了 36.230.172.52 01/27 15:12
l11111111: 所以這次R1版那些巨頭才這麼快有反應 36.230.172.52 01/27 15:12
andy810306: 5萬張是全公司,實際只用2048張H800 1.200.143.73 01/27 15:20
andy810306: 訓練,相當於1500張H100而已 1.200.143.73 01/27 15:20
vbhero: 其實背後都是真人回答,這樣滿意了吧! 122.100.92.240 01/27 15:36
lipstick: 一定是濾鏡過的大叔回答 36.224.85.226 01/27 15:53