推 chenzu740125: 好文同感 07/03 08:03
推 ben121196 : 正2教又贏麻惹 07/03 08:07
推 s555666 : 但nvidia已經榨不出更高的產能 07/03 08:09
→ maplefff : 幹這篇整個就是GPT風, 那個超短斷句一直換行 07/03 08:16
→ maplefff : 真的是從哪裡學來的,看了頭好痛 07/03 08:16
推 bj45566 : 感謝 AI 第一線從業人員提供的資訊 07/03 08:17
→ maplefff : 預訓練資料都是抖音廢文嗎 07/03 08:17
推 jim543000 : cuda被捨棄 nv還剩下什麼 換句話說 矽晶圓走到瓶頸 07/03 08:19
→ jim543000 : 台積電還剩下什麼 07/03 08:19
推 yu1155 : 感謝LDAI @@/ 07/03 08:21
→ ashs92223 : 為啥校稿後排版會這麼怪 @@ 07/03 08:22
prompt沒下好 說要照批踢踢格式排版.... 是誰污染了gpt QQ
※ 編輯: LDPC (98.37.67.135 美國), 07/03/2026 08:25:46
→ yunf : 始作俑者 07/03 08:37
推 deangood01 : 就問一句 佔toB 市場大頭anthropic 推根本不用NVDA 07/03 08:38
→ ActionII : Nv 那一套是真的好用跟方便,付錢就能解決問題 07/03 08:38
→ deangood01 : 你多的那一狗票東西不是錯的 只是商用根本就不用 07/03 08:39
→ deangood01 : Anthropic 推論就兩個TPU + Trainium 07/03 08:39
We train and run Claude on a range of AI hardware—
AWS Trainium, Google TPUs, and NVIDIA GPUs.
上面是人類學的官方啊 人類學也有用到Nvidia GPU
再加上垂直AI全部都用老黃啊 醫療法律會計電影 狗家雲端利潤狂上漲就是
這些垂直AI跟他租Nvidia GPU/Corewave財報也是狂上漲啊 我每天都在跟vllm打架啊
OpenAI 在今年的基礎設施規劃中提到,將新增 3GW 專用 inference capacity,
建立在 NVIDIA Vera Rubin
比方說Harvey 這家AI就是搞律師AI 造成美國初階律師大量失業
https://reurl.cc/X2OQ1D 他就是用Nvidia 去蓋Agent環境
推 squelch : 更正你一下 不是先進製程 是先進封裝 先進製程早 07/03 08:39
→ squelch : 就達到物理極限了 現在只是換方式做而已 07/03 08:39
推 jim543000 : 先進製程還沒到物理極限 下一代才是 07/03 08:42
→ davie11333 : 99記憶卡蛙! 07/03 08:43
推 squelch : 先進製程早就達到極限了,現在根本不講crital size 07/03 08:49
→ squelch : 只用等效多少欺騙社會大眾,這也就是馬斯克在罵的 07/03 08:49
→ squelch : 地方。 其實所謂的nanosheet就是在單層的3D發展元 07/03 08:49
→ squelch : 件,未來跨層還有CFET,腦袋早就動到3D方向去了。 07/03 08:49
→ squelch : 你可以查查台積電製程是什麼時候脫離critical size 07/03 08:49
→ squelch : 的定義。 07/03 08:49
推 ksjr : 不可懷疑我大GG教 99記憶卡蛙 07/03 08:55
※ 編輯: LDPC (98.37.67.135 美國), 07/03/2026 08:59:06
推 josephpu : 老黃市占從8、9成掉到7成,市場就不願意推他了= = 07/03 09:00
→ josephpu : 雖然我想最終還是會來的 07/03 09:00
推 bunjie : 台積製成要微縮 就只能往3D的CFET走 07/03 09:01
→ bunjie : 反正不管哪一家 微縮到後來就是蓋大樓 07/03 09:01
→ bunjie : 其實我覺得最終問題應該還是在於發熱處理 07/03 09:01
→ bunjie : 熱都堆積在3D結構中 怎麼導出來 07/03 09:02
→ hunt0413 : 教主的AMD怎麼辦 07/03 09:03
@@買啊 inference時代 會有很多玩家 AMD好處就是現在市值低 每吃個老黃5%市場
就能暴漲 我算力小隊現在只買蘇媽 老黃就是190以下買 i皇不買
→ bunjie : 不過不過你半導體股票怎麼買GG的確是不可質疑的歸 07/03 09:03
→ bunjie : 宿 07/03 09:03
→ bunjie : 不過不管 07/03 09:03
※ 編輯: LDPC (98.37.67.135 美國), 07/03/2026 09:06:25
推 jim543000 : cd還能再縮半次一次 沒了 可以去看看sem 有縮小 等 07/03 09:06
→ jim543000 : 效歸等效 07/03 09:06
推 Shepherd1987: 錯殺也是殺 把貪狗洗下車 07/03 09:07
推 HiuAnOP : 不可能!GG IS OVER! 07/03 09:21
→ HiuAnOP : 老實說卡哇毛利那麼高了 還只賺這樣才是崩的原因啦 07/03 09:21
→ HiuAnOP : 長期給60%毛利 EPS要會被殺多少? 07/03 09:22
→ HiuAnOP : 產能變3倍 EPS才跟現在一樣 還要掏一堆現金扛折舊 07/03 09:22
→ HiuAnOP : 而且DRAM/NAND標準品長期會有60%毛利?? 07/03 09:23
→ HiuAnOP : 那GG毛利拉到75%都不意外 07/03 09:24
→ HiuAnOP : GG算什麼小隊啊? 不幸小隊嗎QQ 07/03 09:25
推 hunt0413 : 00631L DRAM NVDA AMD 全打包 07/03 09:31
推 create8 : Amd Yes!! 07/03 10:09
→ create8 : 巨頭手下留情呀,留口飯給軟工QQ 07/03 10:10
推 deangood01 : Anthropic 當然也有用NVDA訓練用,推理部分NVDA比例 07/03 11:08
→ deangood01 : 低很多,原因是AWS GCP 有成本更低的trainium TPU 07/03 11:08
→ deangood01 : hyperscaler的毛利更好,況且Anthropic工程師有針對 07/03 11:09
→ deangood01 : 兩個ASIC架構寫底層的kernel 像是NKI for trainium 07/03 11:11
→ deangood01 : 大多數美國前1000企業 一定是用hyperscaler 上面部 07/03 11:12
→ deangood01 : 你說OpenAI用NV本來就不是新鮮事,但他TOB 營收輸 07/03 11:13
→ deangood01 : 還沒有盈利能力,還是要看頭部營利企業,採用的模式 07/03 11:14
→ deangood01 : 有營利才能產生正向現金流,繼續擴大資本開資 07/03 11:14
以及針對人類學 有人推算過他們大概在inferece
還有30%左右是來自NVidia
openai這邊敘述也不太對啊
https://extrapolator.ai/2025/10/12/openais-trillion-token-titans/
openai to-B也是有很多營收來自vertical AI 這些 尤其是Trillion token 俱樂部
在2026年初 OpenAI有說過自己Entrprise已經佔總營收40% 現在ToC 利潤太低
之前已經說過 賺一個用戶20美金一個月 不如賺一個醫生/律師1000美金一個月使用費
https://reurl.cc/R2K879 現在所有AI都是瞄準To-B 哪來的沒盈利
目前openai 比人類學佔優勢就是GPU數量和Infra這部分資源
目前openai arr是33B anthropic arr是47B 大體原因就是openai to-C利潤低
而openai 目前靠者codex和voice agent enterprise (GPT-Realtime-2企業版)
目前語音Agent上 openai做得比Anthropic好 (人類學沒有語音VoiceAgent企業solution)
開始有在to-B有機會挽回一波
infra之優化會反映體驗在這
https://zhuanlan.zhihu.com/p/2038687070491825312
這也是為何自幹infra優化 vs 生態圈優化infra (cuda陣營)
後者還是有一定吸引力
※ 編輯: LDPC (98.37.67.135 美國), 07/03/2026 11:46:11
→ prussian : Anthropic租的xai全都是NV,不用NV的是哪個平行宇宙? 07/03 11:48
對 這邊有細節在infernece增益多少tokens
https://www.anthropic.com/news/higher-limits-spacex
https://reurl.cc/bdZxdy
※ 編輯: LDPC (98.37.67.135 美國), 07/03/2026 11:56:59