推 louisxxiii : QQ這篇有點燒到我 出來溫度如果不是太誇張 09/11 20:20
→ louisxxiii : 還真的有點想換呢 09/11 20:20
→ tint : 這次新架構提昇效益很大 也算是彌補了使用三星製程 09/11 20:22
推 jaspergod : 比較好奇這樣的騷操作 在機器學習有影響嗎QQ? 09/11 20:32
推 s8101026 : 感謝解說 09/11 20:34
推 MK47 : 推 09/11 20:41
→ tsopk45168 : 機器學習ㄧ般情況都是FP32在運算,所以效能相對20系 09/11 20:42
→ tsopk45168 : 列應該會顯著提升 09/11 20:42
https://i.imgur.com/rThmqsm.jpg
這是Ampere架構運算卡GA100的SM結構圖
CUDA仍然是傳統獨立一組FP32單元和一組INT32單元
另外還配置獨立的FP64單元,共用192KB的L1快取
GA100的Tenser Core負責處理FP16、FP8、FP4...運算
還可以處理FP16/FP32的混合精度運算
所以這次繪圖晶片GA102特化FP32的設計
主要提昇的是FP32的運算效能
如果使用的環境以FP16運算為重,提昇效益可能就較有限
不過這次第三代的Tenser Core效率還是會比前代架構高
推 bunjie : 解說清楚 推一個 09/11 20:45
推 k5648550577 : 單8pin RTX3050 效能有2070s itx 09/11 20:50
→ k5648550577 : 短卡,我買兩張起來供 09/11 20:50
推 Jokering5566: 雖然不懂 但是看到遊戲+40%就夠了 09/11 20:56
※ 編輯: tint (218.187.96.230 臺灣), 09/11/2020 21:15:30
→ NanaMizuki : 反正對一般人來說看到cuda暴增就覺得效能也是暴增 09/11 21:18
推 richard82010: 感謝解說,還以為製程提升足以讓CUDA翻倍+暴增太玄 09/11 21:26
推 qweertyui891: 內顯也能這樣搞嗎? 09/11 21:26
推 kuninaka : 推 09/11 21:29
→ friedpig : 這次架構也幾乎是暴增了 原本int 32 跟fp32可以一起 09/11 21:33
→ friedpig : 開 但是int空閒可能太多 換成fp32完整一組 相當於 09/11 21:33
→ friedpig : 以前的兩倍了 不過對上一代增幅就稍微小一點點 09/11 21:33
推 qaz13579 : 等待3050不然就便宜找2060s 970該退休啦 09/11 21:36
→ friedpig : 有傳言10月就會有60了 可能中低階會比上一代的時間 09/11 21:38
→ friedpig : 差小一點點 早點出來 畢竟AMD主力會往那塊打 不可 09/11 21:38
→ friedpig : 能放空 09/11 21:38
推 Marlboro27 : 影馳3080 5499羊 可以參考下 3080的價格了 09/11 22:16
→ kimula01 : 以後遊戲廠應該會慢慢對這個優化 09/11 23:05
推 pc0805 : 這代感覺太吃電,p@55 09/12 00:04
推 vocaloid02 : 看遊戲嗎 09/12 00:18
→ vocaloid02 : 不知道黑沙是吃FP32? 09/12 00:18
推 shanzhang : 推 09/12 01:48
→ enjoynight : 請教這篇看得出來對於影片轉檔輸出的幫助嗎 09/12 11:55
推 b325019 : 至少看起來對madvr幫助應該不小 09/12 17:51
推 aasssdddd : 原來是這樣 看懂了 09/12 21:56