推 c928 : 太專業了 04/07 15:14
推 summer08818 : 一台電腦塞不下換一個機房塞不塞得下 我現在在弄XD 04/07 15:17
整個機房就需要switch 串聯 GPU/TPU,
也就是原文裏頭說的客製化開發的光訊號交換器,
不然你無法做到多台電腦同步運算同一model,
另外一個做法就是用純軟體的方式細切model 分別塞到個別機器,
也就是我的對口同事正在嘗試要做的solution
※ 編輯: waitrop (24.5.140.41 美國), 04/07/2023 15:20:49
推 jagger : 推 04/07 15:24
推 roseritter : 分別塞 細切的方案感覺成本比較省 04/07 15:29
→ acininder : 內行的就知道 大模型最重要的其實是VRAM而非速度 04/07 15:30
→ roseritter : 想起古早56K年代 用PC幫忙解外星人的project 04/07 15:30
→ acininder : transformer系的瓶頸都是記憶體牆 04/07 15:30
推 LieTo : 用NVSwitch or IB(InfiniBand) 04/07 15:30
→ acininder : 包含記憶體容量和存取速度 運算速度反而是其次 04/07 15:31
推 wahaha711233: 類似腦細胞神經連結 30年前的超大電腦又回來了 04/07 15:33
公司內部的project 內容不能說太多,
我只能說在電腦歷史上單一超級電腦或是分散運算小電腦,
這兩個方向已經吵了五六十年以上,
目前Chat model 的確是只有單一超級電腦才能運算,
但是我相信以後一定有解決方法可以用分散運算小電腦,
當年我在做這個AI project的時候,
也是公司兩派立場的爭論: 單一超級或是分散小電腦,
我的project 的研發方向是用分散運算方式去解決AI問題,
可是現在卡關在chat model,
但是我相信未來一定是分散運算的方式,
因為觀看人類電腦歷史,
沒有例外都是分散運算小電腦最後得到勝利
→ acininder : 不過微軟提供給openai的解決方案不是NVlink 04/07 15:36
→ acininder : 而是用InfiniBand把幾萬張A100串起來 04/07 15:36
※ 編輯: waitrop (24.5.140.41 美國), 04/07/2023 15:44:32
※ 編輯: waitrop (24.5.140.41 美國), 04/07/2023 15:45:24
推 speculator : 比較好奇文中說的AI設計晶片是不是真的? 04/07 15:55
推 aegis43210 : AI設計晶片應該指的是軟體定義晶片,也就是Coarse G 04/07 16:11
→ aegis43210 : rained Reconfigurable Arra,目前這塊最成功的是思 04/07 16:11
→ aegis43210 : 科,其網路交換器及虛擬化處理器都有用到類似架構 04/07 16:11
推 donkilu : 分散運算要面對資料傳輸的瓶頸 也有它本身的限制 04/07 16:11
推 wrt : NV之前買下mellanox 04/07 16:12
→ wrt : 可以把多台server用網卡串起來 04/07 16:12
推 donkilu : 短期內搞研究的還是要用類超級電腦 分散運算我覺得 04/07 16:15
→ donkilu : 是用在一些比較成熟的狀況 例如iphone pixel的model 04/07 16:16
推 aegis43210 : Graphcore的IPU也是走單一超級電腦路線,x86陣營則 04/07 16:17
→ aegis43210 : 是嘗試用新一代AMX指令集來搶食訓練大餅,目前是期 04/07 16:17
→ aegis43210 : 待我國新創公司能在AI推理有所成果 04/07 16:17
推 donkilu : 畢竟training目前看起來還是需要大力出奇蹟... 04/07 16:20
推 DB2 : 就說了是比系統不是比晶片,原文推文一堆外行 04/07 16:22
→ acake : 感謝分享 04/07 16:24
推 gs13010 : 其實NV也已經佈局switch了,mellanox 就是做IB連結 04/07 16:29
→ gs13010 : 的公司 04/07 16:29
推 g0428168 : NV的DGX其實應該就有用Mallanox Switch去串全部機台 04/07 16:52
推 Chilloutt : 大頻寬的光交換器準備要商轉了,不怕啦 04/07 17:48
推 roserule : 問個笨問題 TSLA 不是有個 DoJo超級電腦? 是不是 04/07 18:48
→ roserule : 跟文中所提的超級電腦同一個類別? 04/07 18:48
推 soar625 : 很專業,所以可以買啥標的 04/07 19:22
Nvidia跟谷歌,
只有這兩家可以做出chat 的系統,
只是Nvidia 真的股價有點高
→ sleeplist : 請問版上鄉民,像現在高通的晶片,也可以直接作出 04/07 19:26
→ sleeplist : GPU 使用目前最重要的AI類功能嗎,還是說仍然必須 04/07 19:26
→ sleeplist : 使用到 Nvidia的技術? 04/07 19:27
→ sleeplist : 也就是是否就算用高通晶片作出 GPU,也會因為因為 04/07 19:27
→ sleeplist : Nvidia的某些架構或者特殊技術,所以沒辦法用? 04/07 19:27
→ sleeplist : 而且高通這晶片其實去年4月就現市了 04/07 19:38
→ sleeplist : 我實在不太清楚目前這些是都能直接用還是有架構問題 04/07 19:39
推 nkfish : 推個解釋的連文組也能懂 04/07 22:27
※ 編輯: waitrop (24.5.140.41 美國), 04/08/2023 09:43:38
推 cmshow : 推好人分享 04/08 11:14
推 cloudofsky : 推 04/08 13:33
推 stlinman : 推,分享! 04/08 15:50
→ stlinman : 算力的價值建立在產出吧,覺得可以從AI產出去找股票 04/08 15:50
推 noddle : 推分享 04/08 18:21
推 TimoBall : 高通 edge 端 inference 可以吧 你的手機不知道跑多 08/23 19:25
→ TimoBall : 少 ai model 08/23 19:25
→ TimoBall : nv 除了硬體, cuda 也從另一種層面讓 application 08/23 19:27
→ TimoBall : 綁他 08/23 19:27
→ TimoBall : amd 還要抄他們 lib 苦苦追趕 08/23 19:27