[新聞] 新模型 R2 延後主因！DeepSeek 嘗試華為晶片失敗，還是得靠

作者MacBookAir12 (New Mac Water)

看板Gossiping

標題[新聞] 新模型 R2 延後主因！DeepSeek 嘗試華為晶片失敗，還是得靠

時間Thu Aug 14 19:32:02 2025

備註請放最後面違者新聞文章刪除 1.媒體來源: ※ 例如蘋果日報、自由時報（請參考版規下方的核准媒體名單） ※ Yahoo、MSN、LINE等非直接官方新聞連結不被允許科技新報 2.記者署名: ※ 若新聞沒有記者名字或編輯名字，請勿張貼，否則會被水桶14天 ※ 外電至少要有來源或編輯如:法新社作者林妤柔 | 發布日期 2025 年 08 月 14 日 15:22 3.完整新聞標題: ※ 標題沒有完整寫出來 ---> 依照板規刪除文章新模型 R2 延後主因！DeepSeek 嘗試華為晶片失敗，還是得靠 NVIDIA 4.完整新聞內文: ※ 社論特稿都不能貼！違者刪除（政治類水桶3個月)，貼廣告也會被刪除喔！可詳看版規中國人工智慧（AI）公司 DeepSeek 在嘗試使用華為晶片訓練新模型失敗後，延後新一代模型的發布，這也凸顯北京推動取代美國技術的困難。知情人士透露，DeepSeek 在 1 月發布 R1 模型後，受到官方鼓勵，改採用華為昇騰（ Ascend）處理器，而非 NVIDIA 系統。然而，在使用昇騰晶片進行 R2 訓練過程中持續遇到技術問題，因此改回 NVIDIA 晶片進行訓練，僅在推理（Inference）階段使用華為晶片。知情人士透露，這是模型發布從 5 月延後的主要原因，導致 DeepSeek 在競爭中落後。所謂「訓練」是模型透過大量資料集中學習，「推理」則利用已訓練好的模型進行預測或產生回應。由此可知，中國晶片在關鍵任務上仍落後美國競爭對手，這也是中國追求半導體自給自足所面臨的挑戰。外媒《金融時報》（FT）指出，北京已要求中國科技公司必須為訂購 NVIDIA H20 晶片提供正當理由，藉此推廣華為、寒武紀（Cambricon）等國產替代方案。業界人士認為，與 NVIDIA 產品相比，中國晶片存在穩定性問題、晶片間連線速度較慢，以及軟體水準較差等劣勢。據悉，華為曾派出一支工程師團隊前往 DeepSeek 辦公室，協助利用其 AI 晶片開發 R2 模型。但即使如此，DeepSeek 仍無法在昇騰晶片上成功完成一次訓練。不過，DeepSeek 與華為合作改為將模型在推理（Inference）階段能相容於昇騰晶片。知情人士透露，DeepSeek 創辦人梁文峰在內部表達對 R2 進展不滿，並努力投入更多時間打造更先進模型，以維持公司在 AI 領域的領先地位。R2 發布延後的原因還包括更新模型所需的資料標註時間比預期更長，根據中媒報導，該模型有望在未來數週內發布。加州大學柏克萊分校 AI 研究員 Ritwik Gupta 認為，將昇騰用於訓練這方面，華為正在經歷「成長痛」，但預期它最終會適應，「我們今天還沒看到用華為訓練的領先模型，不代表未來不會發生。這只是時間問題」。 5.完整新聞連結 (或短網址)不可用YAHOO、LINE、MSN等轉載媒體: ※ 當新聞連結過長時，需提供短網址方便網友點擊 https://tinyurl.com/3dahpvrc 6.備註: ※ 一個人一天只能張貼一則新聞(以天為單位)，被刪或自刪也算額度內，超貼者水桶，請注意 ※ 備註請勿張貼三日內新聞(包含連結、標題等) 中又贏疑老黃也是中國人所以中又贏沒錯 -- 桃園與舞雪之光 https://i.imgur.com/ZGzxwgN.jpg https://i.imgur.com/uoh8K51.jpg https://i.imgur.com/zgbMzHp.png https://i.imgur.com/kIwwW5e.png https://i.imgur.com/0VNzKh4.png https://i.imgur.com/bUjLU5D.jpg https://i.imgur.com/XlK5CHy.jpg https://i.imgur.com/mIxUZ1Y.jpg https://i.imgur.com/Hb5T4dI.jpg https://i.imgur.com/7byz7MN.jpg -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 112.104.26.214 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1755171126.A.6C6.html

噓 zwxyzxxx: 美國技術X 台積電技術O 111.248.198.23 08/14 19:33

→ sunday0913: 還不是要靠我黃爸！ 101.10.63.242 08/14 19:33

→ mithralin: 不是因為蒸餾不出新東西嗎？ 111.71.47.62 08/14 19:34

→ winterson: 華為這款不也是轉白手套找GG做的嗎？222.250.252.215 08/14 19:34

→ raisn: 過氣218.173.225.190 08/14 19:36

→ tsaiweili: 華為加油！愈多家下單台積愈開心！ 111.82.166.57 08/14 19:39

→ Leo4891: 原來是被華為坑了還是得靠輝達h20 1.160.72.124 08/14 19:42

推 TexasFlood: Deepseek爛到連小粉紅都嫌 126.166.83.151 08/14 19:42

推 zeumax: 主要差異還是Nv在演算法架構比較完善 110.28.58.64 08/14 19:51

→ zeumax: 而且現在Ai幾乎都用NV，連AMD都少人在用， 110.28.58.64 08/14 19:52

→ zeumax: 演算法如果沒配合晶片就是有效能差異 110.28.58.64 08/14 19:52