作者tint (璇月)
看板VideoCard
標題Re: [情報] GTX1080比TITAN X效能提升30% !
時間Mon May 16 07:37:51 2016
※ 引述《tank9 (飛星)》之銘言:
: 標題: [情報] GTX1080比TITAN X效能提升30% !
: 時間: Fri May 13 14:57:51 2016
: 30%效能提升
: 感覺很猛
: 未來會有GTX1080TI嗎
: 9系列又會出現拋售潮吧
Videocardz網站揭露了GTX 1080的完整規格
http://goo.gl/BvhyaH
GP104晶片面積314mm2,比GM204的398mm2小了一些
電晶體數量為72億個,GM204則為52億個
有趣的是,SM數量是20組
從2560個CUDA去算的話
可以發現GP104維持Maxwell架構的每SM(M)有128個CUDA
而非先前傳聞的Pascal架構每SM將改良為64個CUDA
從該文章上貼出的 GP104 Block Diagram也可以觀察到
每組SM總共為128個CUDA
結構和Maxwell的Block Diagram很類似
文章提到要到GP100時才會改良為每組SM是64個CUDA
過往從Fermi開始採用SM單元的設計以來
每代SM中CUDA數量的變化都是明顯的
Fermi(每SM有32SP)->Kepler(每SMX有192SP)->Maxwell(每SMM有128SP)
但這次Pascal架構的GP104仍維持每SM是128個CUDA
比較這次GP104的改變
1.雙精度浮點效能的提昇?
(電晶體數量比GM204增加了20億個,CUDA只增加512個)
2.ROP數維持GM204的64個,但引入新的圖像壓縮技術
文章中提到比GM204能提高1.7倍的等效記憶體頻寬
3.硬體解碼線路的提昇
https://en.wikipedia.org/wiki/Nvidia_PureVideo
PureVideo的版本看來會比GM206(GTX960)還新
-----
之前網友的討論有提到
GP104的每CUDA同時脈下其實並沒有比GM204快
從這篇跑分來看
http://tinyurl.com/gn8gmth
如果GTX980的晶片時脈從1216MHz->1733MHz
CUDA數目從2048個->2560個
換算後可得到約23000分,還比GTX1080約22000分還快一些
如同板上這篇Khadgar大提到的
https://www.ptt.cc/bbs/VideoCard/M.1462589286.A.501.html
如果不靠時脈提昇效能的話
同時脈下GP104的CUDA效能是和前代Maxwell差不多
必須算上時脈的提昇,每CUDA效能才有增長
我覺得這樣子
也許GP104使用的Pascal架構(GP100或許會在改良)
其實是Maxwell架構的新製程高頻改良版而已!?
再加上支援新技術(圖像壓縮技術)、新功能(硬解規格)
(或者也有補回雙精度效能)
如這篇討論
http://bbs.pceva.com.cn/thread-131069-1-1.html
GP104在DX12的Asynchronous Compute效能
可能就是靠高時脈來硬上了?
在PC_Shopping板也有網友提到這部份
之前看一些討論
Pascal架構是2014年才突然在Nvidia的路線上插入的
之前的路線圖Maxwell架構後就是接著Volta
Pascal架構可能像是墊檔用的改良架構
或許16nm製程的真正全新架構要等到Volta
如同Mxwell之於Kepler在同製程下的改進一樣(970能打到780)
obov大的推文
DX12效能暴增可能要等到Volta
https://www.ptt.cc/bbs/PC_Shopping/M.1462861708.A.9D0.html
平心而論
這次GP104用新製程時脈大幅提昇衝高效能也算是有提昇
1080/1070目前公佈的價格沒有比前代980/970貴太多
接下來就看AMD能拿出怎樣的產品和怎樣的價格來對打了
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 218.187.85.25
※ 文章網址: https://www.ptt.cc/bbs/VideoCard/M.1463355479.A.A93.html
※ 編輯: tint (218.187.85.25), 05/16/2016 07:47:16
推 Khadgar: 突然發現這個Block Design的圖好像怪怪的... 05/16 08:11
→ Khadgar: 1080竟然有8個記憶體控制器? 是GDDR5X需要這樣嗎? 05/16 08:14
→ JoyRex: 32位元控制器啊... 05/16 10:51
→ Khadgar: GPU的記憶體控制器是64bit已經非常非常非常久了 05/16 12:07
→ Khadgar: GT200 8個,GF100/110 6個, GK110 6個,GM200 6個 05/16 12:09
→ JoyRex: 會轉貼至少看下文章裡面寫的東西吧... 05/16 12:15
→ JoyRex: GP104 is equipped with eight 32-bit memory controllers 05/16 12:16
→ JoyRex: 這一行都沒看就直接貼出來了? 05/16 12:16
→ JoyRex: 人家貼的東西至少看一下吧!除非又是愚人節的玩笑... 05/16 12:18
推 iceyeman: 他是在試16nm高頻極限吧??? 05/16 17:24
→ tint: 這樣做或許是可以配合1070甚至更低的1060Ti產品來刪減? 05/16 19:23
→ qhua: 跟那沒關係 05/16 20:24
推 IL2: 我贊成tint大的推測,因為AMD在HD5K的時代也是這樣玩,NV強推還 05/17 22:47
→ IL2: 不夠成熟的fermi反而搞得灰頭土臉. 而且我猜AMD在北極星之後 05/17 22:50
→ IL2: 的下一代中階甚至中高階又會是馬甲,然後碰上全新架構的Volta 05/17 22:51
→ tint: HD5000系列的DX11特性Tessellation效能偏弱 當年它這樣做是 05/17 23:33
→ tint: 沿用之前流處理器架構的設計 然後加上DX11功能的支援 05/17 23:33
推 IHD: 480沒有灰頭土臉吧? 當初猛攻效能啊 是現在有功耗能打才打吧? 05/18 02:02
→ tint: Fermi架構時Tessellation效能贏HD5000系列不少 不過功耗偏高 05/18 02:14
推 IL2: 因為當初GTX480預定的規格更強,是因為功耗和良率一直搞不定才 05/19 23:09
→ IL2: 閹掉一部分變成後來的GTX480,然後NV搞定480又多花了幾個月,結 05/19 23:11
→ IL2: 果變成比HD5870晚半年才上市,然後效能比預期差,功耗也不好看 05/19 23:12
→ IL2: 最主要會被酸(?)的點是,AMD放話說HD5870不是頂階,頂階讓給NV 05/19 23:14
→ IL2: 就像是現在NV說要拿GTX980打AMD的Fury吧,結果沒想像中的贏很 05/19 23:17
→ IL2: 打好對NV後來的決策造成相當程度的影響 05/19 23:19
→ IL2: 當初還有人放話GTX480會讓HD5870看不到車尾燈,原始規格的 05/19 23:22
→ IL2: GTX480應該是很強悍,也讓NV很有信心會完虐HD5K,可惜了 05/19 23:24