→ HiuAnOP : HBM還是需要啦!只是DDR5跟NAND一起上陣殺敵! 07/03 10:40
→ fatb : 看有沒有降價就知道了 07/03 10:43
→ chiangww : 聯發科的呢?難道是騙砲? 07/03 10:43
推 roseritter : CXL之前有喊一波 07/03 10:43
→ fatb : 這問題的答案真的是太簡單 07/03 10:43
→ maimss : 太累了,研究太多不如持續做多就好了 07/03 10:44
→ maimss : 反正總是會嘎空軍 07/03 10:44
→ fatb : Meta只是打不贏 放棄虧錢事業而已 07/03 10:44
→ Qoo20811 : 堅持當卡蛙就是覺得卡蛙的遠期本益比至少要跟CPU差 07/03 10:52
→ Qoo20811 : 不多 07/03 10:52
推 hanszaza : 感謝優文 07/03 10:54
推 devilsabre : 推 07/03 10:54
推 seemoon2000 : 算力離過剩還遠咧 不然你現在打開gpt或claude開最 07/03 10:54
→ seemoon2000 : 耗算力的推理跑半小時試試看會不會限流 07/03 10:54
推 XenonFat : 想藉題請教一下新創Etched那一顆晶片未來有沒有戲? 07/03 10:55
→ hanszaza : 卡哇 mrvl 康寧 gg to the moon 07/03 10:55
推 ezmlzvu : 是缺 07/03 10:56
推 sdbb : 敬祝國慶假期愉快 07/03 10:57
推 maplefff : 我希望能深入CXL怎麼解決decoding 07/03 11:02
→ maplefff : 記憶體頻寬不足的問題? 07/03 11:02
→ maplefff : 不然容量解決了, TPS下降到1/10不到也沒用啊 07/03 11:02
→ maplefff : 另外現在等容量的DRAM和HBM價差似乎已經不值得 07/03 11:02
→ maplefff : 另外投資DRAM擴容系統,因為成本根本沒降低? 07/03 11:02
推 ztsc0304356 : 請問Meta + Qualcomm 各一顆, 那第三顆是 07/03 11:06
→ ohya111326 : 結論 最大受益者 TSM 07/03 11:07
推 dosiris : 第三顆就Marvell跟狗狗做的MPU 07/03 11:09
→ dosiris : 其實是第三顆最可能被普及 07/03 11:10
推 ztsc0304356 : 對齁 都忘了有這顆 謝謝大大 07/03 11:10
→ ZO20 : 算力過剩笑死 專案現在都交叉平台跑 要怎樣過剩啦 07/03 11:16
→ FatFatQQ : 實際上需求越來越大 人類要擔心的是自己 07/03 11:23
推 JAM950317 : 算力不會過剩 但股市本體還是金融博弈不是技術 07/03 11:24
推 flycarb : 推TQ王。 07/03 11:25
→ FatFatQQ : 以後的資本—把人類房子拆掉 蓋資料中心 07/03 11:26
推 yulun1984 : 不用討論那麼多 一直多就好了 07/03 11:29
→ oyaji5566 : 這些都不重要 華爾街要的是什麼時候開始賺錢 07/03 11:29
推 k255033 : 電力無限就不會算力過剩了吧 07/03 11:30
→ sheep2009 : 有用agent就知道 算力需求是無限的 07/03 11:33
→ jacokon : 既然是業內的話,至少先把寫的東西用AI查證下吧 07/03 11:35
→ jacokon : 瘋狂打臉耶:作者把近期幾家科技巨頭為了省錢、回收 07/03 11:35
→ jacokon : 舊資源和開發新架構的新聞混為一談,甚至說出「這三 07/03 11:35
→ jacokon : 顆很可能是同一顆晶片」這種嚴重的技術常識錯誤。 07/03 11:36
→ jacokon : 「這顆晶片已經賣到全世界幾乎每家公司,包含阿里、 07/03 11:36
→ jacokon : 百度,已經賣翻了」——這與原始新聞直接矛盾 07/03 11:36
→ sheep2009 : 現在就是看誰能把token成本壓到最低 誰就是贏家 07/03 11:37
→ jacokon : 其它錯誤就不一一列舉了 07/03 11:38
→ sheep2009 : 壓到最低也要維持 latency/throughput 07/03 11:39
推 YoungLoka : 老哥 有沒有可能他講已經賣翻的那顆跟你說的是不同 07/03 11:41
→ YoungLoka : 東西 07/03 11:41
推 maplefff : 我感覺CXL更多是agents 共同上下文KV快取復用技術 07/03 11:42
→ maplefff : 不是用於解決長上下文decoding memory wall的問題 07/03 11:42
→ jacokon : 他講賣翻的那顆,很明顯是承接前幾句:"同一顆晶片" 07/03 11:48
推 jim543000 : 目前已知事實 推論就是使用dram沒錯 07/03 11:51
推 jim543000 : 我在大概一個半月前就說過了 07/03 11:53
推 jiansu : Inference 用aisc加上in memory compute 看起來真 07/03 11:55
→ jiansu : 的會這樣走 主要是瓶頸就記憶體頻寬 靠設計封裝去 07/03 11:55
→ jiansu : 解合理 算力沒那麼重要 文中同一顆這個就比較不清 07/03 11:55
→ jiansu : 楚 07/03 11:55
推 pig0038 : 研究那麼多幹嘛,最後還不是 all in gg 07/03 11:55
推 pig0038 : gg 漲不下去或者沒資本支出消息就是沒了 07/03 11:58
噓 deangood01 : 縮個網址吧 07/03 11:59
→ pig0038 : 怕的話就緊盯毛利率,毛利率開始下降也代表有機會 07/03 12:04
→ pig0038 : 沒了 07/03 12:04
→ ksjr : 有趣的是我把這篇文給三個不同AI分析Gemini表示贊同 07/03 12:05
→ ksjr : A家和O家都在質疑"同一顆晶片" AI很聰明會查作者IP 07/03 12:06
噓 OxFFFFFFFF : 到底哪一篇有提到 in memory compute?? 07/03 12:12
→ OxFFFFFFFF : 你到底懂不懂什麼是in memory compure? 07/03 12:13
The MPU aims to offload in-memory computing tasks to alleviate TPU
bottlenecks in memory bandwidth, thereby improving system efficiency in
high-concurrency inference scenarios.
Qualcomm reveals HBC near-memory AI architecture, AI250 and AI350
accelerators — touts 6x higher bandwidth-per-watt compared to HBM, 200x
capacity compared to on-chip SRAM
我不知道是你的英文閱讀問題還是你的AI 模型有問題
推 maplefff : PIM感覺根本沒看到所謂的成熟方案 07/03 12:17
推 namenone : CIM都在偷偷做啦,但都在testcip的階段吧 07/03 12:19
※ 編輯: waitrop (76.103.225.6 美國), 07/03/2026 12:47:07
→ kausan : 他可能沒訂閱 07/03 12:55
推 sdbb : 補血 07/03 13:00
→ sdbb : 相信老黃和tqqq 王的仙人指路 07/03 13:01
推 hellomo : 推TQ大 07/03 13:03
推 TIPPK : 99三星海力士 07/03 13:08
→ TRYING : 實體AI 也不能不用記憶體啊 07/03 13:21
→ jacokon : 這三篇確實沒有做到「in-memory compute」 07/03 13:59
→ jacokon : 其實都是「near-memory compute」在技術上是不同的 07/03 13:59