作者qazxc1156892 (QQ)
看板Tech_Job
標題[新聞] 低成本高效能AI模型或再度引發美股慘烈震
時間Mon Apr 28 17:26:27 2025
新聞標題: 低成本高效能AI模型或再度引發美股慘烈震盪
鉅亨網編譯 莊閔棻 2025-04-28 15:10
中國人工智慧(AI)公司 DeepSeek 似乎即將再度在市場上投下震撼彈。隨著 DeepSeek
即將發布的 R2 AI 模型細節再度流出,市場對該模型的關注再次掀起波瀾,並可能又對
美國股市,尤其是科技股,造成衝擊。
據報導,
雖然目前 DeepSeek 尚未正式公布 R2 的具體規格,但中國媒體引述消息指出,
R2 將採用升級版的專家混合(Hybrid MoE)架構,並可能結合先進的(gating mechanis
ms)與 Dense 層(dense layers)設計,專為優化高負載運算。新模型的參數量預計將
達到驚人的 1.2 兆,是 R1 的兩倍。
根據爆料,DeepSeek R2 在每個字元(token)的單位成本上,比 GPT-4 暴降了 97.4%,
輸入(input)每百萬個字元只要 0.07 美元,輸出(output)每百萬個字元則只要 0.27
美元。與 OpenAI 目前的收費標準相比,R2 將成為企業市場上極具吸引力的高效能、低
成本選擇。
這樣的成本優勢,無疑將對美國 AI 公司造成嚴重衝擊。市場分析指出,若 DeepSeek R2
真如預期般強勢推出,將使 OpenAI 等企業面臨前所未有的競爭壓力,進而影響美股科
技類股的表現。
值得一提的是,DeepSeek R2 不僅在參數規模和成本上實現突破,還在硬體層面實現了自
家技術的深度整合。
DeepSeek 選擇全程依賴華為 Ascend 910B 晶片群進行訓練,把華為
Ascend 910B 晶片群利用率推到了 82%,FP16 精度算力實測達到 512PetaFLOPS,接近
同規模輝達 A100 群 91% 的性能。
資料還顯示,DeepSeek R2 的訓練資料量高達 5.2PB,並在多項測試中表現出色。特別是
在 C-Eval2.0 中文語言測試中,R2 達到了 89.7% 的優異成績;在 COCO 資料集上,R2
的電腦視覺能力也達到了 92.4%,顯示其不僅在語言處理方面有顯著突破,也在視覺識別
領域有了長足進展。
除了在參數規模和成本上取得突破,DeepSeek R2 還在模型部署方面創新。報導稱,
R2
可在 8bit 量化壓縮模式下將模型體積縮小至 83%,同時精度損失控制在 2% 以內,大大
提升 AI 模型在終端設備上的部署可能性,為未來的 AI 應用開啟了新的大門。
DeepSeek R2 的發布或將成為科技股的重大挑戰。DeepSeek R1 曾經讓美國股市遭遇慘痛
損失,尤其是對輝達等 AI 晶片製造商造成巨大打擊,市值一度蒸發 6000 億美元。隨著
R2 的消息逐步流出,美股投資者開始擔心中國 AI 企業再次在市場上掀起新的風暴。
新聞來源:
https://reurl.cc/LaaRNa
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.243.82 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1745832389.A.8DB.html
→ samm3320 : 晚點開盤再看看 42.73.192.85 04/28 18:02
→ ooo820312 : 結果成本都省在人事費用 211.23.35.162 04/28 18:10
推 ohlong : 跟川普一樣沒人信道了 223.138.45.142 04/28 18:46
推 iPadProPlus : 這超難用的東西誰要用 111.71.213.133 04/28 19:22
推 havochuman : Deepseek用過就知道差openai很遠,雖 116.89.92.222 04/28 20:18
→ havochuman : 然已經是牆內最強了 116.89.92.222 04/28 20:18
推 PoloHuang : 套模 27.53.131.9 04/28 21:55
→ WenliYang : 好了啦 沒人在乎囉 27.52.131.73 04/28 21:57
推 lovebabyqqq : 崩了啊 1.34.183.95 04/28 23:11