推 smallreader: (加入願望清單 03/08 11:56
推 overno: 加價賣 03/08 12:01
推 tagalong1024: 推~ 03/08 12:21
推 ayanami00: 但是有專業需求的,不會需要省這個錢在這個價位上買吧 03/08 12:32
推 Arbin: 看你的「專業需求」到哪邊,不過依照本版標準大概會先叫你 03/08 12:35
→ Arbin: 用colab 03/08 12:35
→ tint: 這張卡主要是一些專業運算有趨近3060Ti表現 且又有12GB VRAM 03/08 12:36
推 oopFoo: 你想的太複雜了。一個是4MB/SM的L2,一個是3MB/SM的L2。 03/08 12:59
→ oopFoo: 某些運算,L2多的贏。 03/08 13:00
→ oopFoo: 然後rtx40系列,L2加大很多。 03/08 13:02
→ tint: NV它SM的L2會一起砍 之前桌面3050用GA106核心 SM的L2砍到2MB 03/08 13:12
→ tint: 像40系列的4060桌面版 之前的爆料L2從AD107滿規32MB砍到24MB 03/08 13:15
※ 編輯: tint (218.187.100.246 臺灣), 03/08/2023 13:16:26
推 leviva: 請問oop大,三倍L2 / 三倍L3, 哪一種cpu跑遊戲更快? 03/08 13:17
→ tint: 像3060 GA104和3050 GA106 它的L2仍是砍成標準的3MB和2MB 03/08 13:18
→ tint: NV的刀工是很細膩的 像當年970就是刀法太細膩砍到ROP數量 03/08 13:23
→ tint: 才會造成後來的3.5GB VRAM爭議事件 03/08 13:23
→ tint: 970實際上的規格是56個ROP L2為1.75MB而不是最初宣稱的2MB 03/08 13:26
推 oopFoo: 是啊,NV可以砍,但砍下來,性能因為調度而差那麼多?不太 03/08 14:06
→ oopFoo: 可能。現在跑gpu code,基本上等data的時間是最多的,線序 03/08 14:07
→ oopFoo: 再多,幫助有限,卡還是卡資料頻寬。NV跟I家都是增加L2, 03/08 14:09
→ oopFoo: 因為現代硬體跟程式碼的架構,加L2的效果較好。在GPU裡L3 03/08 14:13
→ oopFoo: 有點尷尬,還不如記憶體頻寬加大一點,主要是GPU吞吐資料 03/08 14:15
→ oopFoo: 量實在太大,大L2+大頻寬的效果是目前最好的。 03/08 14:17
→ oopFoo: 如何有效利用L2的locality一直是最佳化的問題。加大比較 03/08 14:24
→ oopFoo: 簡單,改程式比較困難。 03/08 14:25
→ wertyorz: 這個3060的12G一出,那個謠傳的4060 8G就真的不用混了 03/08 14:34
→ tint: 當年的2060 TU104版 L2規格一樣砍成3MB 但Blender渲染結果 03/08 14:45
→ leviva: 看到時候實際價錢,如果12490~12990元/等效3060 ti, 4060 03/08 14:47
→ leviva: 又會是絕大多數人的首選 03/08 14:47
→ tint: 效率提昇非常多 這其實滿有趣的 03/08 14:47
→ tint: 當年2060Super的L2完整保留 規格有標出L2是完整4MB 03/08 14:48
→ tint: 如果2060 TU104版和3060 GA104版 實際上規格是完整L2 4MB 03/08 14:50
→ tint: 那只能說NV非常佛心了 03/08 14:51
推 wolver: 價格才是重點 03/08 14:53
→ wolver: 皮衣刀客現在沒那麼佛心 03/08 14:54
→ tint: L2快取都是標示3MB而已 如果實際上是4MB 這就非常有趣了 03/08 14:57
推 oopFoo: 我可能猜錯,但性能差這麼多,如果L2不變,那就是L2的 03/08 15:00
→ sorrojvr: ai當道 老黃只會越來越貴 03/08 15:01
→ oopFoo: latency差很多。但latency差多的話,基本上所有程式都會有 03/08 15:02
→ oopFoo: 改進。所以猜L2的size不一樣是最有可能的。我還是不相信 03/08 15:03
→ oopFoo: 線序調度可以差這麼多。不是不可能,但我想不出怎樣的程式 03/08 15:06
→ oopFoo: 會這樣。 03/08 15:06
→ tint: 如果L2容量沒砍 這樣應該也會反映在遊戲效能上? 03/08 15:11
→ tint: 當時我幫人裝機 有裝過ASUS和EVGA的3060 GA104版 03/08 15:11
→ tint: 型號3060 Dual和3060 XC 但和GA106標準版遊戲效能幾乎沒差別 03/08 15:13
推 oopFoo: L2沒砍,遊戲影響比較小,compute影響比較大。主要是106的 03/08 15:22
→ oopFoo: sm/gpc比104的sm/gpc多。理論上反而是106在調度上有優勢, 03/08 15:23
→ oopFoo: 所以我實在想不出需要多跨gpc效能反而高?到底是什麼神奇 03/08 15:25
→ oopFoo: 程式。不然就是L0的設計是不一樣。不管如何我還是盲猜 03/08 15:26
→ oopFoo: 是Cache的幫助。 03/08 15:27
推 dreamix: 好哦,3060Ti Pro Max 真是太專業滿出來 03/08 16:50
→ ksng1092: 是說他為什麼要在消費級市場出一個可以跑專業運算的東西 03/08 16:58
→ StarHero: 卡是奈米製程,刀工也是奈米等級的 03/08 16:58
→ StarHero: 因為晶片還一大遍山頭的庫存 03/08 16:59
→ leo3258: 老黃聽到各位的心聲 這張加價多賣5k很合理 03/08 18:56
推 AreLies: 庫存太多 03/09 01:02
→ sam80709: 便宜的還在海上漂 03/09 13:31
→ tint: 目前有差異的都是重度渲染運算工作 並沒有太神奇的程式 03/17 16:50
→ tint: 我覺得有可能04等級以上的晶片 SM和GPC的比例更符合重度運算 03/17 16:51
→ tint: GA104每組GPC是8個SM單元 GA106每組GPC是10個SM單元 03/17 16:53
→ tint: GA106這樣的配置比例 可能滿載重度運算下前端會有瓶頸 03/17 16:59
→ tint: 滿載處理效率沒有GA104的配置高 但06級以下畢竟更要成本考量 03/17 17:01