Re: [心得] MEM資料X6壓縮，七巨頭硬體資產過剩風險

作者maplefff (降息の恐怖嘎鱷)

看板Stock

標題Re: [心得] MEM資料X6壓縮，七巨頭硬體資產過剩風險

時間Thu Mar 26 20:28:48 2026

※ 引述《teddy98》之銘言： : 黃仁勳NVIDIA，濫用VRAM 容量來壟斷市場。手法惡質、黑心! : : 他企圖讓每一張卡的效能剛好精準地卡在某個價位。 : : 如果你想多跑一點 AI 模型或開更高解析度 : : 這張卡的顯存就會「剛好」爆掉，逼你必須加錢買更高一階， : : 甚至買貴 5 到 10 倍的專業工作站卡。 : : : 但是隨著記憶體X6壓縮技術問世 : : 使得硬體資產重估：七巨頭（微軟、Meta、亞馬遜...）過去兩年瘋狂囤積 H100。如果壓 : 縮技術普及， : 原本需要 6 台伺服器的算力，現在 1 台就能達成。 : : 效能倍增：壓縮不只省空間，還能減少資料傳輸量。這意味著目前的 PCIe 頻寬或 HBM頻 : 寬會顯得「變寬了 6 倍」，大大提升運算效率，降低能耗。 : : MEM 壓縮 X6 本質上是一種「由軟體定義的硬體升級」。它會讓輝達透過 VRAM 容量建 : 立起來的定價權瞬間化為烏有。看 AI 發展不能只看現狀 LLM 每4-6月就大改版, 眼光得放到兩三年後。記憶體壓縮技術帶來的並非硬體需求縮減而是讓上下文長度與模型能力直接翻六倍這種技術突破只會誘發更大量的 AI 採用，當模型變得更好用、更普及時 DRAM 的總體需求量反而會噴發得更厲害。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.71.213.34 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1774528130.A.B94.html

推 sdbb : 台肯 03/26 20:32

推 bear753951 : 就跟上次的ds一樣，好用的ai只會造成更多人用而已 03/26 20:40

推 h0103661 : 可以讀跟讀的懂是兩回事，上下文佔用大小變1/10不 03/26 20:40

→ h0103661 : 代表注意力能放大10倍== 03/26 20:40

推 holysong : 日肯，ai爆發記憶體才開始缺貨 03/26 20:52

噓 amingfirst : 一個記憶體各自表述大家都很會講時間來證明啦 03/26 20:53

→ amingfirst : ㄏ 03/26 20:53

推 heyjude1118 : 看資本支出能不能在新技術衝擊前回收 03/26 20:56

→ hutten : 如果這能讓AI進步，那AI需求不是飽滿而是進入更高速 03/26 21:11

→ hutten : 發展 03/26 21:11

推 jen1121 : 記憶體之於AI應用就像錢一樣，有人嫌多？ 03/26 21:45

→ StarRoad : 想從60分變90分，砸錢不手軟；但現在要再花一倍的 03/26 21:54

→ StarRoad : 錢變95分，可就不一定划算了。所以不是說瓶頸少了 03/26 21:54

→ StarRoad : 就代表更多投入 03/26 21:54

→ abuu0929 : 6倍是跟古老的模型比，實際頂多降低25% 03/26 22:02

推 js850604 : 硬體需求永遠不嫌多，向來是硬體限制軟體發展 03/26 22:15

推 TRYING : 不要小看人類的欲望 CC 03/26 23:11

→ HiuAnOP : 雀食 03/26 23:23

推 hank78321 : 傑文斯 03/26 23:55

推 okbon : 去槓桿先砍再說 03/27 00:00

→ bndan : 配件之所以叫配件就是因為上限被人鎖住了純加裝 03/27 00:23

→ bndan : 有有邊際效應講難聽的夠便宜才能拉高上限貴就是 03/27 00:23

→ bndan : 只剩「高價值」硬需求而已 03/27 00:23

推 g9911761 : 循環股要循環了嗎 03/27 02:29

推 z83420123 : kv cache只佔整個記憶體的1-2% 單純獲利了結+殺股 03/27 03:54

→ z83420123 : 價才有機會重新讓利潤夠 03/27 03:54

→ z83420123 : 商業伺服器大概可以占30% 03/27 03:56

推 howdiee : 幾年前的60分是威爾史密斯吃麵現在60分是醬板鴨 03/27 09:36

→ howdiee : 懂得都懂 03/27 09:36