噓 a123453906: 這排版頭痛 03/22 18:26
→ lovinlover: 這中文我看不太懂 03/22 18:44
噓 disword: 拉基排版 03/22 18:46
→ disword: 直接END 03/22 18:46
噓 Cubelia: 看到這ID先噓就對了 03/22 18:55
噓 slsamg7112: 共三小 03/22 19:02
噓 powyo: 朝聖 先卡位 說不定你會成為一代顯卡大師 03/22 19:20
→ powyo: 天才總是孤獨的 愛迪生小時候也被當成智障 03/22 19:20
噓 novarossi: 你的電腦被追殺你的外星人入侵了 快拿去丟 03/22 19:35
→ wind0083: 連看兩次都忍不住END 03/22 19:45
噓 henrry2220: ... 03/22 19:47
噓 weihung0520: 別吸毒了 03/22 20:14
噓 Rivendil: 廠廠 03/22 20:34
→ a34021501: 我直說好了,其實我也不懂,只是看到很多東西沒裝好! 03/22 20:40
→ a34021501: 例如AMD SPB SMBUS Controller的x64裡面有檔案很可疑! 03/22 20:41
→ a34021501: 大家可以多看看裡面的ReadMe,不然AMD真的很辛酸血尿! 03/22 20:51
→ a34021501: 我覺得驅動根本早已寫好了,只是某些.sys因規範不能放! 03/22 20:57
噓 novarossi: 你看不懂還能PO一篇 03/22 21:03
噓 ken841520: 不管他嗑了什麼,都給我來一點(゚∀゚) 03/22 21:11
→ a34021501: 別再噓我了喔,這方法就是可以把不存在的裝置裝進去! 03/22 21:21
→ a34021501: 大家可以試著裝進其他裝置,只要沒錯誤應該就是存在! 03/22 21:21
→ a34021501: 可參考 amdpsp.inf 的內容,明確描述 ExcludeID 的用法 03/22 21:23
噓 ww578912tw: 你到底嗑了什麼一天到晚講瘋話 03/22 21:25
噓 novarossi: 偏要噓 03/22 21:29
噓 novarossi: 早就看穿你的鬼扯少在那邊 03/22 21:38
噓 Bob9154: ID正確 03/22 21:40
請大家幫我思考一下系統參數PATH要怎麼設置才能讓驅動抓取正確的DLL檔 > echo %PATH%
以下是依檔案時間排序的PATH清單,請大家幫忙測試如何調整最洽當或有其他資料夾可加!
C:\Program Files\AMD\CIM\Bin64;C:\Program Files
(x86)\AMD\CNext\CCCSlim;C:\Program Files\AMD\CNext\CNext;C:\Program Files
(x86)\AMD APP SDK\3.0\bin\x86_64;C:\Program Files (x86)\AMD APP
SDK\3.0\bin\x86;%SystemRoot%\system32;%SystemRoot%;%SystemRoot%\System32\Wbem;%SYSTEMROOT%\System32\WindowsPowerShell\v1.0\;
謝謝大家,剩下的就交給你們了!
※ 編輯: a34021501 (1.164.252.34), 03/22/2017 21:55:57
噓 Cubelia: 能被退文這麼多次我也是醉惹 03/22 21:59
噓 GORDON2037: 這是在講三小 03/22 22:00
噓 alexgame01: 你到底怎麼辦到的 03/22 22:00
噓 novarossi: 跟A片放一起不會喔 03/22 22:07
噓 yuetsu: 不噓對不起自己 03/22 22:17
噓 charlie20083: 亂版成這樣都沒事 這版規真的沒問題嗎? 03/22 22:20
噓 ddrdod: 《登入次數》3421 次《有效文章》318 篇 (退:5) 03/22 22:22
噓 damnedfish: 挖這啥啊 03/22 22:36
噓 yichenglee: 去看醫生 03/22 23:03
噓 FeRin: 你到底是在洗文章洗P幣還是洗退文? 03/22 23:09
噓 FeRin: 不過說實在的,我不太希望他被水桶欸,畢竟電蝦都死了…能 03/22 23:24
→ FeRin: 炮的只剩a34了 03/22 23:24
噓 novarossi: 我也不希望 玩PTT這麼久就他最厲害 03/22 23:58
→ a34021501: 可以在 檢視 > 裝置(依連線) 切到這個 View!! 03/23 00:51
噓 a5150219: 我竟然看完了… 03/23 01:00
為確保AMD顯示卡驅動程式的DLL檔會優先讀取,我的PATH最前面加了這行路徑!
C:\AMD\WHQL-Win10-64Bit-Radeon-Software-Crimson-ReLive-17.2.1-Feb28\Packages\Drivers\Display\WT6A_INF\B311170;
因為有時候系統.DLL會被改(更新或後門),如此AMD驅動的DLL檔最為優先讀取!
當然在驅動中Bin64裡面執行ATISetup.exe -Install -output screen 安裝後!
會將AMD CIM裝入 C:\Program Files\AMD\CIM\Bin64 我覺得適合放在更前面~!
因為在17.2.1版本中,CIM的編譯時間是2/28,DisplayDriver與CCCSlim編譯時間是2/10
還有就是 Bin64\translations 裡面放的檔案的編譯時間是3/1 或許值得放在更前面!
至於測試效能,就和我之前用280X與16.12.2測試GTA5的4K@60一樣可以順暢跑高畫質!
※ 編輯: a34021501 (1.164.252.34), 03/23/2017 01:52:35
→ a34021501: 我忘了加 -txaa 參數畫質很差,在此向各位的眼睛致歉! 03/23 02:02
來談談記憶體好了,關於記憶體Benchmark的軟體我覺得都已經不夠看了,畢竟都莫名的慢
C:\Users\Card\AMD APP SDK\3.0\samples\opencl\bin\x86_64>ConstantBandwidth.exe
--device cpu
Platform 0 : Advanced Micro Devices, Inc.
Platform found : Advanced Micro Devices, Inc.
Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : AMD FX-8320E Eight-Core Processor Device ID is
00000040305C1EF0
Build Options are : -D DATATYPE=float4 -D DATATYPE2=float4 -D SIZE=5120 -D
IDXTYPE=ulong
AccessType : single(static index)
VectorElements : 4
Bandwidth : 98.2572 GB/s
AccessType : single(dynamic index)
VectorElements : 4
Bandwidth : 99.157 GB/s
AccessType : linear
VectorElements : 4
Bandwidth : 118.709 GB/s
AccessType : random
VectorElements : 4
Bandwidth : 14.2031 GB/s
C:\Users\Card\AMD APP SDK\3.0\samples\opencl\bin\x86_64>ConstantBandwidth.exe
--device gpu
Platform 0 : Advanced Micro Devices, Inc.
Platform found : Advanced Micro Devices, Inc.
Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : Tahiti Device ID is 0000006DBDFA91A0
Build Options are : -D DATATYPE=float4 -D DATATYPE2=float4 -D SIZE=5120 -D
IDXTYPE=ulong
AccessType : single(static index)
VectorElements : 4
Bandwidth : 8212.22 GB/s
AccessType : single(dynamic index)
VectorElements : 4
Bandwidth : 8641.56 GB/s
AccessType : linear
VectorElements : 4
Bandwidth : 2213.72 GB/s
AccessType : random
VectorElements : 4
Bandwidth : 1075.47 GB/s
以上是 CPU 讀取 DDR3 與 GPU 讀取 GDDR5 的數據,透過 OpenCL 可以瞭解普通程式很慢
所以不管怎樣這些裝置彼此溝通的 PCI-E 通道的頻寬就會影響電腦的效能所以不能被降速
※ 編輯: a34021501 (1.164.252.34), 03/23/2017 06:32:56
噓 moonlca: 不懂電腦可以去上點課嗎 你當電資只有google? 03/23 07:23
噓 jslee: 《有效文章》318 篇 (退:5) 03/23 12:14
噓 sk10037643: 你到底再寫三小 03/23 14:03
噓 pcfox: 板主好像都自動無視這個ID的文章 03/23 15:43
噓 FeRin: OC版倒是只剩下一次機會了QQ 03/23 15:50
噓 humbug0453: 這個我還是看不懂 03/23 16:33
噓 FeRin: 他的文就當娛樂用吧,至少可以噓到爽 03/23 17:16
噓 leehome12345: 這個版是不桶人的嗎? 03/23 17:39
噓 powyo: 應該沒違反版規吧 03/23 18:01
噓 novarossi: 路過再噓 03/23 19:04
推 duece0927: 你需要醫生嗎 03/24 01:38
噓 pcfox: 原來可以無限唬爛不用被桶,隔壁版的業代還真可憐 03/24 02:09
我沒有無限唬爛,我的PCI-E仍然被限制在PCI-Express Gen2即8GB/s左右只是有超過一點
C:\Users\Card\AMD APP SDK\3.0\samples\opencl\bin\x86_64>ImageBandwidth.exe
Platform found : Advanced Micro Devices, Inc.
Device 0: Tahiti
Build: _WINxx release
Pixel format: CL_RGBA / CL_UNSIGNED_INT32
Image width: 1024
Image height: 1024
Image origin: 0 0
Image region: 1024 1024
Image size in bytes: 16777216
Region size in bytes: 16777216
Global work items X: 1024
Global work items Y: 8
Total work items: 8192
Pixels per thread: 128
Local work items X: 16
Local work items Y: 8
Number of groups: 64
Timing loops: 10
Repeats: 1
Kernel loops: 100
Kernel launches: 1
inputImage: CL_MEM_READ_ONLY
outputImage: CL_MEM_WRITE_ONLY
Host baseline (single thread, naive):
Timer resolution 793 ns
Page fault 1018 ns
Barrier speed 127 ns
CPU read 4.40 GB/s
memcpy() 5.89 GB/s
memset(,1,) 9.77 GB/s
memset(,0,) 9.39 GB/s
AVERAGES (over loops 2 - 9, use -l for complete log)
--------
1. Host mapped write to inputImage
clEnqueueMapImage(WRITE): 0.002644 s [ 6.34 GB/s ]
memset(): 0.002569 s 6.53 GB/s
clEnqueueUnmapMemObject(): 0.002999 s [ 5.60 GB/s ]
2. GPU kernel read of inputImage
clEnqueueNDRangeKernel(): 0.008412 s 199.43 GB/s
verification ok
3. GPU kernel write to outputImage
clEnqueueNDRangeKernel(): 0.010325 s 162.49 GB/s
4. Host mapped read of outputImage
clEnqueueMapImage(READ): 0.002647 s [ 6.34 GB/s ]
CPU read: 0.001958 s 8.57 GB/s
verification ok
clEnqueueUnmapMemObject(): 0.000020 s [ 821.96 GB/s ]
Passed!
8.57GB/s就是我的CPU從我的GPU的DDR5讀取記憶體的資訊的速度大概就是比PCI-E Gen3慢
由此可知推論我已經超過PCI-E Gen2的標準並且仍然只有Gen2多一丁點的傳輸速率而已喔
畢竟以往的理論速度幾乎不會超過,我想知道這個傳輸速率要怎麼DDL才能發揮系統效能!
※ 編輯: a34021501 (1.164.252.34), 03/24/2017 15:49:30
噓 FeRin: 那你乾脆把GPU拿來做日常浮點運算,VRAM當系統記憶體,把C 03/24 16:59
→ FeRin: PU拔掉算了 03/24 16:59
噓 FeRin: 然後呢?重點呢? 03/25 08:19