看板 Gossiping 關於我們 聯絡資訊
備註請放最後面 違者新聞文章刪除 1.媒體來源: ※ 例如蘋果日報、自由時報(請參考版規下方的核准媒體名單) ※ Yahoo、MSN、LINE等非直接官方新聞連結不被允許 科技新報 2.記者署名: ※ 若新聞沒有記者名字或編輯名字,請勿張貼,否則會被水桶14天 ※ 外電至少要有來源或編輯 如:法新社 作者 林 妤柔 | 發布日期 2025 年 08 月 14 日 15:22 3.完整新聞標題: ※ 標題沒有完整寫出來 ---> 依照板規刪除文章 新模型 R2 延後主因!DeepSeek 嘗試華為晶片失敗,還是得靠 NVIDIA 4.完整新聞內文: ※ 社論特稿都不能貼!違者刪除(政治類水桶3個月),貼廣告也會被刪除喔!可詳看版規 中國人工智慧(AI)公司 DeepSeek 在嘗試使用華為晶片訓練新模型失敗後,延後新一代 模型的發布,這也凸顯北京推動取代美國技術的困難。 知情人士透露,DeepSeek 在 1 月發布 R1 模型後,受到官方鼓勵,改採用華為昇騰( Ascend)處理器,而非 NVIDIA 系統。 然而,在使用昇騰晶片進行 R2 訓練過程中持續遇到技術問題,因此改回 NVIDIA 晶片進 行訓練,僅在推理(Inference)階段使用華為晶片。知情人士透露,這是模型發布從 5 月延後的主要原因,導致 DeepSeek 在競爭中落後。 所謂「訓練」是模型透過大量資料集中學習,「推理」則利用已訓練好的模型進行預測或 產生回應。由此可知,中國晶片在關鍵任務上仍落後美國競爭對手,這也是中國追求半導 體自給自足所面臨的挑戰。 外媒《金融時報》(FT)指出,北京已要求中國科技公司必須為訂購 NVIDIA H20 晶片提 供正當理由,藉此推廣華為、寒武紀(Cambricon)等國產替代方案。 業界人士認為,與 NVIDIA 產品相比,中國晶片存在穩定性問題、晶片間連線速度較慢, 以及軟體水準較差等劣勢。 據悉,華為曾派出一支工程師團隊前往 DeepSeek 辦公室,協助利用其 AI 晶片開發 R2 模型。但即使如此,DeepSeek 仍無法在昇騰晶片上成功完成一次訓練。不過,DeepSeek 與華為合作改為將模型在推理(Inference)階段能相容於昇騰晶片。 知情人士透露,DeepSeek 創辦人梁文峰在內部表達對 R2 進展不滿,並努力投入更多時 間打造更先進模型,以維持公司在 AI 領域的領先地位。R2 發布延後的原因還包括更新 模型所需的資料標註時間比預期更長,根據中媒報導,該模型有望在未來數週內發布。 加州大學柏克萊分校 AI 研究員 Ritwik Gupta 認為,將昇騰用於訓練這方面,華為正在 經歷「成長痛」,但預期它最終會適應,「我們今天還沒看到用華為訓練的領先模型,不 代表未來不會發生。這只是時間問題」。 5.完整新聞連結 (或短網址)不可用YAHOO、LINE、MSN等轉載媒體: ※ 當新聞連結過長時,需提供短網址方便網友點擊 https://tinyurl.com/3dahpvrc 6.備註: ※ 一個人一天只能張貼一則新聞(以天為單位),被刪或自刪也算額度內,超貼者水桶,請注意 ※ 備註請勿張貼三日內新聞(包含連結、標題等) 中又贏 疑 老黃也是中國人 所以中又贏沒錯 -- 桃園與舞雪之光 https://i.imgur.com/ZGzxwgN.jpg https://i.imgur.com/uoh8K51.jpg https://i.imgur.com/zgbMzHp.png https://i.imgur.com/kIwwW5e.png https://i.imgur.com/0VNzKh4.png https://i.imgur.com/bUjLU5D.jpg https://i.imgur.com/XlK5CHy.jpg https://i.imgur.com/mIxUZ1Y.jpg https://i.imgur.com/Hb5T4dI.jpg https://i.imgur.com/7byz7MN.jpg -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 112.104.26.214 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1755171126.A.6C6.html
zwxyzxxx: 美國技術X 台積電技術O 111.248.198.23 08/14 19:33
sunday0913: 還不是要靠我黃爸! 101.10.63.242 08/14 19:33
mithralin: 不是因為蒸餾不出新東西嗎? 111.71.47.62 08/14 19:34
winterson: 華為這款不也是轉白手套找GG做的嗎?222.250.252.215 08/14 19:34
raisn: 過氣218.173.225.190 08/14 19:36
tsaiweili: 華為加油!愈多家下單台積愈開心! 111.82.166.57 08/14 19:39
Leo4891: 原來是被華為坑了 還是得靠輝達h20 1.160.72.124 08/14 19:42
TexasFlood: Deepseek爛到連小粉紅都嫌 126.166.83.151 08/14 19:42
zeumax: 主要差異還是Nv在演算法架構比較完善 110.28.58.64 08/14 19:51
zeumax: 而且現在Ai幾乎都用NV,連AMD都少人在用, 110.28.58.64 08/14 19:52
zeumax: 演算法如果沒配合晶片就是有效能差異 110.28.58.64 08/14 19:52