推 brmelon : 看不懂 只能推QQ 07/02 00:37
推 dctmax : 不是做電路的 看不懂+1 QQ 07/02 00:38
推 jasn4570 : 無腦推就對惹 07/02 00:39
推 obov : QQ 07/02 00:39
推 chro924xxxx : 先推再看 07/02 00:40
推 MrDisgrace : 看無推QQ 07/02 00:40
推 kuninaka : 推 07/02 00:40
→ chro924xxxx : 阿 看不懂QQ 07/02 00:40
→ KotoriCute : 太高深了看不懂QQ 07/02 00:41
推 chibon1992 : 幫教主QQ 07/02 00:41
推 b155073 : Jk大必推 不過好想知道為什麼ACE會被刪減阿 07/02 00:41
基本上ACE/ROP等只看數量變化不準
因為不同的設計 不要說不同代了
同一代內的高低階晶片都不一定一樣
一組ACE不一定做一樣多的事情 搞不好更多了..
而就算是簡化的設計也很多啊
G92/G80都是2-way VLIW,但是是1+0.5個MAC
後來G200就取消那0.5個了
然後ATI的VLIW5很快就簡化成VLIW4
因為第5個不但很少用 也沒人排的出4+1的指令.
通通都是4+0 or 0+1,所以就砍了一個也少點損失
推 vic88001 : 看不懂 = = 07/02 00:42
推 obov : 用不到就先刪阿QQ 大家都馬拿產品作實驗 07/02 00:42
※ 編輯: jk21234 (42.72.117.179), 07/02/2016 00:47:05
→ obov : 8葛ace用不太到 先砍到四葛試水溫QQ 07/02 00:43
推 pmes9866 : 快推不然別人以為我看不懂 07/02 00:44
推 jasn4570 : 懶人包應該放在最上面 我都拉完了.... 07/02 00:44
推 w113353 : DX12不是會用到嗎QQ 07/02 00:44
推 freshego : 快推避免別人知道我看不懂 07/02 00:44
推 seemoon2000 : 這篇技術含量太高 只能推了 07/02 00:44
推 b155073 : QQ 應該是用不到那麼多 一個甜品級的概念 07/02 00:45
推 ang728 : 推 深入淺出 07/02 00:46
推 qxxrbull : micro-stuttring跟侏儒畫格是同個意思嗎? 07/02 00:47
推 yys310 : 拜 07/02 00:48
→ ang728 : 同意思 07/02 00:48
推 SilverFox : …也太多頁,看到眼花 07/02 00:54
推 JackChung : intrinsic那邊應該就是把GCNㄧ些用高階語言難表示 07/02 01:01
→ JackChung : 的功能包成函數 07/02 01:01
→ JackChung : 像同一wavefront資料洗牌這種功能 07/02 01:02
→ b155073 : 這不就要遊戲廠商去針對gcn作特殊的優化 07/02 01:09
→ b155073 : 還是這個是對計算所做的 07/02 01:09
推 kzfun2001 : 嗯,原來是這樣 07/02 01:09
→ JackChung : CU reservation 那頁是講說可以為 command queue保 07/02 01:11
→ JackChung : 留專用的CU 07/02 01:11
→ JackChung : 像是說RX480上有36個CU 我便可以專門切4個出來專門 07/02 01:13
→ JackChung : 算某幾個特定的kernel 07/02 01:13
→ JackChung : 其他kernel去分其他32個 07/02 01:14
→ kuma660224 : AFR frame pacing就是要解決多GPU輸出frame時間差 07/02 01:14
推 b155073 : 對岸有說rx480 frame的延遲比之前的A卡更低了 07/02 01:17
→ b155073 : 感覺跟這裡提到的AFR無關? 07/02 01:17
→ kuma660224 : 這可能搭配DX12非同步計算能力,在delay插入其他非 07/02 01:17
→ kuma660224 : 繪圖工作? 07/02 01:17
推 CactusFlower: 嗯 好像暸解了些什麼呢! 07/02 01:26
推 damnedfish : 快推,不然人家以為我看不懂 07/02 01:29
→ JackChung : shader intrinsic 需要遊戲對GCN最佳化 07/02 01:29
推 jior : 快推,不然別人以為我看不懂!!! 07/02 01:29
→ JackChung : 計算部份也當然是用得到 07/02 01:30
→ kuma660224 : Variable Rate Shading那邊說的不是vertex shader 07/02 01:38
→ kuma660224 : 而是能應需求變化改變繪圖品質,比如視點看的位置 07/02 01:40
→ kuma660224 : 高解析高畫質,外圍餘光處低解析低畫質。 07/02 01:40
→ kuma660224 : 不過這可能需要搭配其他硬體偵測眼球看的位置 07/02 01:41
推 oasis822 : 看不懂 推就對了… 07/02 01:45
推 i9602283 : 太專業看不懂。。。 07/02 01:45
→ kuma660224 : VR兩眼其實還是硬體要算兩次vertex shader, 07/02 01:49
→ kuma660224 : 因為兩眼座標不同,這邊的一pass是指軟體 07/02 01:49
→ kuma660224 : 只處理送出一份模型,但有兩組矩陣轉換座標 07/02 01:49
→ kuma660224 : Cpu處理的API與Driver可以省工,但GPU其實仍處理兩 07/02 01:50
→ kuma660224 : 次 07/02 01:50
→ kuma660224 : 所以VR很操GPU,但卻不一定操CPU... 07/02 01:50
→ kuma660224 : 這些技術可以提升軟體處理效率,但GPU仍加倍負荷 07/02 01:52
→ kuma660224 : 用比喻就是可以跟點菜的(CPU)說來兩桌類似的菜 07/02 01:55
→ kuma660224 : 只是這個不要辣,那個不吃牛。 07/02 01:55
→ kuma660224 : 點菜小妹的一次搞定兩桌,效率很好。 07/02 01:55
→ kuma660224 : 但是廚房還是得紮實做出兩桌,沒法省事。 07/02 01:55
→ kuma660224 : VRS那邊才是未來能幫GPU大廚省事的功能。 07/02 01:55
→ kuma660224 : 等於告訴廚師,我們只在意主菜,小菜你隨便上就好 07/02 01:56
→ kuma660224 : VR離眼睛注視處以外的區域邊邊角角糊一點無所謂。 07/02 01:57
→ kuma660224 : 但主菜=視點注視處要確實做好做滿。 07/02 01:58
→ Litfal : GPU上16bit好像夠用,我搞別的DSP的演算法倒是常常 07/02 02:34
→ Litfal : 遇到16bit精度不夠的問題OTZ 07/02 02:34
→ JackChung : fp16應該是特別為DNN搞的吧 07/02 02:37
→ kuma660224 : FP16在手機GPU很普遍,因為省電晶體。 07/02 02:39
→ kuma660224 : 其實FP16很好用了,只有某些狀況精度差會出包要避開 07/02 02:40
→ kuma660224 : PC現在是因為走GPU多用途化,GPGPU時機到了 07/02 02:41
→ kuma660224 : 開始有更多兼差的工作不需要高精度。 07/02 02:42
推 obov : nv這樣手筆很大 額外開一顆大顆的專作gpgpu 07/02 02:51
→ obov : 那種大顆光罩來一次就破10M惹好像 07/02 02:51
→ kuma660224 : 他退出手持晶片,總要找東西塞滿約好的產能 07/02 03:01
→ kuma660224 : 而且搞不好繪圖也用的上。 07/02 03:02
推 obov : 他那整組要賣十二萬鎂耶 根本是瞄準估狗之類的 07/02 03:10
推 fishxd1096 : 樓上obov 完全看不懂先推 07/02 04:14
推 howyuan : 推 07/02 04:57
推 AxAy : 推~ 07/02 07:13
→ ericinttu : 樓下是圖論大師 07/02 08:17
推 Cubelia : 專業 07/02 08:24
推 WeAntiTVBS : 推 07/02 08:39
推 giantwinter : !! 07/02 08:42
推 ping870224 : EE系看懂一點幫推 07/02 08:47
推 Ekmund : 這太猛了... 07/02 09:24
推 wert213 : 快推不然人家以為我看不懂 07/02 09:35
推 terry6503 : 資訊量龐大,還好是早上看到,推~ 07/02 09:46
推 semihumanity: 請問一下,warp不是相當於wavefront嗎?1warp有32t 07/02 10:14
→ semihumanity: hread;1CU有8wavefront,1wavefront有64workitem 07/02 10:14
→ semihumanity: 。thread相當於workitem 07/02 10:14
→ nucleargod : 不同一張卡 warp 會不一樣大喔 07/02 10:30
推 semihumanity: 不過後來好像都改成1wavefront32workitem了的樣子 07/02 10:32
→ nucleargod : 現階段 VR 軟體端還是硬幹居多,軟體上寫畫兩遍 07/02 10:32
→ nucleargod : 你硬體提供了畫一遍的神技,沒人拿去套也是沒用 07/02 10:33
推 felaray : 好複雜 看不太懂 只能跪了... 07/02 13:08
推 otoni : 嗯……算了,先推再說 07/02 13:19
推 kanyewest927: 我們講同一種語言? 07/02 23:25
→ kanyewest927: 膝蓋痛痛的... 07/02 23:26
推 nfsong : 專業推 07/03 13:38