作者s213092921 (麥靠貝)
看板Gossiping
標題Re: [新聞] 新模型 R2 延後主因!DeepSeek 嘗試華為晶片失敗,還是
時間Fri Aug 15 12:57:25 2025
Deepseek從今年2月就遷到華為升騰晶片了
然後用華為升騰晶片訓練,今年5月28日發佈R1模型的強化版
https://www.ettoday.net/news/20250529/2968935.htm
https://www.wantgoo.com/news/1227793
成績有目共睹
現在突然靠不知名人士發佈小作文說華為升騰不可靠
也是很搞笑的
中國科大訊飛的星火AI模型也是100%完全使用華為升騰晶片訓練
排名也是中國國內AI第一梯隊
那你覺得Deepseek玩不過科大訊飛嗎?
至於Deepseek R2大模型延遲發佈,目前知道是因為更換底層架構
很多訓練的東西對不上,所以需要時間調整
照過往規律應該是先發佈V4的底層模型,然後再發佈R2的定律模型
https://hao.cnyes.com/post/184614
這篇論文是DS未來會套用在R2的先行暴雷劇透
DS不是商業化經營,不用像Close AI把GPT4.6包裝成GPT5強行上市揠苗助長
--
Gossiping 綜合 ◎[八卦] 本板沒有特定立場
PTT八卦板自創立以來,一直秉持著公正、中立的立場,
以一個自由且不受限制之資訊交流平台而自居,
從而廣受國內外人士好評愛戴。
是故,由眾多使用者推舉出任之板主,
自然需承襲八卦板的一貫作風:
只問對錯,不問立場。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 117.56.237.199 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1755233850.A.F8A.html
推 Informatik: 給那些只想臭對岸的說那麼多 誰聽得懂 1.163.244.241 08/15 12:59
→ panda816: 最後一段XD 39.14.73.6 08/15 12:59
推 hermanwing: 低調 101.8.160.138 08/15 13:01
推 wsdykssj: 那篇看起來NSA吊爆了 123.252.19.17 08/15 13:07
推 meta41110: 凸( ゚д゚)凸不是阿爛鳥不是說都沒人 49.216.253.213 08/15 13:16
→ meta41110: 用 49.216.253.213 08/15 13:16
推 asiaking5566: GPT5反向升級真的繃不住 42.73.216.90 08/15 13:19
推 squeakywheel: 反正會臭中國的就那幾個帳號 看久太 101.10.247.95 08/15 13:37
→ squeakywheel: 熟悉了 101.10.247.95 08/15 13:37
推 bitcch: closedAI:謝謝你們的研究 我們會好好使用 49.218.139.63 08/15 14:12
推 GiPaPa: DS連自己國內的競業模型都輸 真的沒救 210.71.217.249 08/15 15:13
推 meta41110: 凸( ゚д゚)凸台灣的嘴砲AI更可悲吧都 49.216.253.213 08/15 19:24
→ meta41110: 空談最會 49.216.253.213 08/15 19:24