看板 PC_Shopping 關於我們 聯絡資訊
CUDA 護城河現階段很深很廣 原文轉自 UNIKO's Hardware 網頁好讀版:https://reurl.cc/RWb8eg https://i.imgur.com/usggQmS.jpg
AI 這個名詞絕對是今年與未來最火熱的議題之一,目前出現各類生成式 AI 應用,例如 Ch atGPT 和 Stable Diffusion,為產業帶來全新的發展路線。 為了讓生成式 AI 應用有更高效的產出,AMD、Intel 與 NVIDIA 等晶片廠商皆不斷研發新 的軟硬體,以期在這塊市場上取得更多收益。這次筆者就利用目前持有的三張入門顯示卡 ( ARC A380、GTX 1650 和 RX 6400),來讓讀者了解三家晶片廠商的入門產品能提供多少運算 效能。 GUNNIR ARC A380 Photon 6G OC 外觀 筆者這張 ARC A380 品牌是 GUNNIR,是一張需要外接電源的版本,目前台灣電商平台有銷 售的 SPARKLE ARC A380 ELF 則無需外接電源。兩者主要差別是 GPU 加速頻率。 據 TechPowerUp 資料庫顯示,ARC A380 Photon 6G OC 加速頻率是 2450 MHz,ARC A380 ELF 加速頻率是 2050 MHz,差了 400 MHz。 ARC A380 Photon 6G OC 外盒正面印有產品外觀彩圖,散熱器跟外接電源的設計,讓它看起 來不像入門級顯示卡。右上角標示該卡為 Intel ARC 3 系列成員,支援 XeSS 超採樣技 術和 DirectX 12 Ultimate API。 背面標示該卡需要的環境配備,例如 350W 以上並且有 8 Pin PCIe 電源接頭的電源供應器 、建議 8GB 以上系統記憶體、AMD Ryzen 3000 系列及更新的處理器並能開啟 Resizable BAR 功能的平台,以及 Windows 10 或 Windows 11 64 位元系統。 https://i.imgur.com/mxcUogL.jpg
https://i.imgur.com/XPjzpaP.jpg
正面可以看到整體採黑色雙風扇散熱器,背面也有一塊黑色的金屬強化背板,已經是接近中 階顯示卡才有的待遇,整體尺寸不含擋板為 222 x 114 x 42 mm。 https://i.imgur.com/IBg77zj.jpg
https://i.imgur.com/ftMSDXH.jpg
內部可以看到有一塊不小的鋁擠散熱片,還有一根導熱管。 上方印有 Intel ARC 字樣,8 Pin 電源插座旁還有一塊 GUNNIR Logo 的發光區域,正常 開機時會發藍光。 https://i.imgur.com/3bHdodZ.jpg
https://i.imgur.com/G2AvEDq.jpg
在影像輸出方面,具備 1 個 HDMI 2.0 跟 3 個 DisplayPort 2.0 輸出接頭,是新台幣 40 00 左右顯示卡中輸出接頭最多的。 https://i.imgur.com/pmjdbng.jpg
硬體規格 處理器:AMD Ryzen 5 5600X (關閉 PBO) 主機板:ASUS PRIME B550M-K/CSM 記憶體:XPG SPECTRIX D60G DDR4 RGB 3000 8GB x2 (OC 3200) 顯示卡: 1.ASUS Dual Radeon RX 6400 2.GUNNIR ARC A380 Photon 6G OC 3.ZOTAC GAMING GeForce GTX 1650 Low Profile儲存:ADATA Legend 710 螢幕TUF Gaming VG27AQL1A ZAKU II EDITION 驅動版本: ASUS Dual Radeon RX 6400 - AMD Software : Adrenalin Edition 23.11.1 GUNNIR ARC A380 Photon 6G OC - Intel Arc & Iris Xe Graphics 31.0.101.4972 ZOTAC GAMING GeForce GTX 1650 Low Profile - GeForce Game Ready 546.17 作業系統:Windows 11 23H2 (關閉防毒) 電源設定:平衡模式 性能與遊戲測試 3DMark 不免俗的還是要跑一下 Benchmark,首先是 3DMark,Time Spy 中 ARC A380 分數最高,Fi re Strike Extreme 中則是 RX 6400 表現最佳。 https://i.imgur.com/QGgqja4.png
https://i.imgur.com/AzV85eD.png
Geekbench 再來是 Geekbench,OpenCL 性能 GTX 1650 具備優勢,Vulkan 則是 RX 6400 領先,而 AR C A380 在這兩項測試中性能皆居次。 https://i.imgur.com/Pli4iaj.png
https://i.imgur.com/Wa5EqHB.png
GravityMark Vulkan GravityMark Vulkan 的顯示卡性能排名與 Geekbench Vulkan 相同,表示 RX 6400 在 Vul kan API 的效能表現是三者中最強的,只是大家性能差距也不大。 https://i.imgur.com/UKJVTYP.png
Counter-Strike 2 簡單試個遊戲,首先是 Counter-Strike 2,由於是入門顯示卡,所以筆者統一使用 1080P 120Hz 低特效全螢幕設定,地圖選 Dust 2 進行 AI 對戰,結果 RX 6400 出現畫面異常不 能玩,只有在未設定全螢幕前的視窗化狀態下正常,因此 RX 6400 在這項沒有成績。GTX 1 650 在 CS2 遊戲測試中 AVG FPS 最高。 https://i.imgur.com/i9dhqCL.png
Overwatch 2 接著測 Overwatch 2,一樣是 1080P 120Hz 低特效全螢幕,關閉動態渲染比率,遊戲解析 度設定 100%,最大幀率 300,地圖 66 號公路,AVG FPS 由 RX 6400 勝出。 https://i.imgur.com/yEqZ53l.png
AI 相關應用測試 Stable Diffusion WebUI 現在進入重頭戲,先來試個最常用的本地 AI 應用 Stable Diffusion WebUI,模型使用 St able Diffusion V1.5,GTX 1650 用的是AUTOMATIC1111 的 Stable Diffusion web UI, 版本 1.6.0;ARC A380 用的是 openvinotoolkit 的 Stable Diffusion web UI,版本 1. 6.0;RX 6400 使用 Nod.AI 專為 AMD RDNA 顯示卡最佳化的 Shark (Vulkan API),版本 20231009.984。測試使用的設定和 Prompt 跟「Stable Diffusion AI 生圖加速新利器! 透過 LCM LoRA 大幅提升生圖速度」這篇*註1 相同,測試結果顯示 Intel 的 OpenVINO 加速相當出色,速度讓對手看不到車尾燈。 註1:https://reurl.cc/E4ZWYK https://i.imgur.com/ea2bs1W.png
本地 LLM 大型語言模型運作效能測試 筆者使用 KoboldCpp V1.5 載入 Taiwan-LLM-7B-v2.1-chat-Q4_K_S.gguf 模型進行測 試,設定只更改 Presets,GTX 1650 選擇 cuBLAS,ARC A380 和 RX 6400 選擇 CLBlast, 詢問的問題是「什麼是LLM」,連續三次。圖片排序左至右依序是 GTX 1650、ARC A380、RX 6400,測試結果顯示 GTX 1650 效率最高,RX 6400 次之。 https://i.imgur.com/kkTADmY.jpg
https://i.imgur.com/9UBUEYp.jpg
https://i.imgur.com/Y38feG5.jpg
AI 影片放大補幀效能測試 測試工具使用 Waifu2x-Extension-GUI 版本 3.108.01, 放大工具選擇 Real-CUGAN ncn n Vulkan,放大倍率為預設的 2X,補幀工具選擇 RIFE ncnn Vulkan,針對各顯示卡開啟硬 體加速選項,圖片儲存格式用 WebP,圖片品質設 80,測試的影片來源 (360P) 可按此下載 *註2。 此項測試由 GTX 1650 拿下冠軍,RX 6400 獲得亞軍。 註2:https://reurl.cc/mrv77A https://i.imgur.com/My89rrL.png
結論 以一般娛樂用途而言,在新台幣 4000 這個價位上,三款顯示卡的效能其實差不多,要是真 的想跑 AI 應用,那麼 NVIDIA 的顯示卡絕對是目前最穩的選擇,AI 相關應用軟體基本上 都支援 CUDA,可以讓你獲得下載即可用的體驗。 在本次測試結果中,AMD 顯示卡雖然性能表現不如 NVIDIA (這邊僅考慮 Windows 平台) , 透過 OpenCL 或 Vulkan API 還是可以獲得一定程度的效果。另外,AMD 的 ROCm 雖然說已 登陸 Windows 平台,但筆者使用 KoboldCpp 的 ROCm 版本只能正常開啟程式,載入模型 後就自己關閉了,而 Shark 從 Vulkan 改為 ROCm 會顯示錯誤出不了圖,因筆者手上沒 AM D 更高階的顯示卡 (本身偏好用無須外接電源的顯示卡),不曉得是不是 VRAM 不夠所以跑 不了,或是有其他原因,也希望能在 Windows 系統上看到更多最佳化解決方案出現。 至於 Intel ARC 顯示卡在 AI 的發展,只要 Intel 持續積極對社群 / 開發者進行資源投 入,以本次 Stable Diffusion WebUI 測出來的效率來看,在 Windows 系統的未來令人期 待。 筆者並非 AI 相關產業人員,對這方面並不熟悉,若是大家有更準確且方便比較性能的測試 方法 / 工具歡迎提出,希望是以簡單安裝、容易使用且免費或開放原始碼,能夠在 Window s 系統正常運作為主。關於 AI 應用測試結果僅供參考,測試期間為 11 月底至 12 月初, 有機會且剛好有硬體的話會繼續測試一些東西給大家看。 喜歡我們的文章歡迎分享原文 也可以UNIKO's Hardware 粉絲專頁並設為最愛,或是到 UNIKO's Hardware 官方網頁逛逛 ,觀看各種開箱及測試! -- Sent from my Nothing A065 PiTT // PHJCI -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.238.40.102 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1704125774.A.E82.html ※ 編輯: AreLies (36.238.40.102 臺灣), 01/02/2024 00:17:17
abc21086999: 破產版AI114.36.220.23 01/02 00:17
Koogeal: 雜魚們等級對決是嗎?125.227.172.24 01/02 00:33
tint: 5000價位的話 2月會出3050 6GB版 免外接電卡218.187.85.131 01/02 01:07
tint: 3050 6GB對比這幾張多了Tensor Core218.187.85.131 01/02 01:07
tint: 相對比較的話 3050 6GB好像也還行XD218.187.85.131 01/02 01:08
其實現行的3050 8G會更好用 只是價格太貴 捏上3060 12G還比較有CP值 ※ 編輯: AreLies (36.238.40.102 臺灣), 01/02/2024 01:44:46
jaffson8909: 推 223.136.93.175 01/02 02:09
smallreader: 想知道入門顯卡跟SoC的NPU能比嗎 114.27.27.55 01/02 02:13
wsdykssj: APU(780M)呢? 完全不能打? 119.14.85.132 01/02 02:27
oopFoo: Arc a380也有xmx(tensor core)。 219.70.128.119 01/02 06:55
oopFoo: intel/amd的igpu/dgpu跑LLM選擇MLC會快很 219.70.128.119 01/02 06:57
oopFoo: 多。OpenCL基本上優化的不夠。MLC用vulkan 219.70.128.119 01/02 07:00
oopFoo: 效果更好。vLLM看起來也蠻有潛力的。 219.70.128.119 01/02 07:02
oopFoo: koboldcpp/llamacpp主要是普及,易入門, 219.70.128.119 01/02 07:03
oopFoo: cpu/gpu自動幫你配好,N家優化極好。 219.70.128.119 01/02 07:04
oopFoo: LLM現在的發展極快,變化也很快,希望明年 219.70.128.119 01/02 07:05
oopFoo: 不對,今年上半年有比較明顯的結果出來, 219.70.128.119 01/02 07:06
oopFoo: NPU目前支援都不好。AMD的NPU鎖在onnx後面 219.70.128.119 01/02 07:07
oopFoo: 支援可能更難. 219.70.128.119 01/02 07:08
guezt: 顏色選擇好怪啊 一般是用i藍 n綠 A紅吧 39.9.34.112 01/02 07:36
yenchieh1102: 推比較 111.71.34.185 01/02 07:50
IKnowWhy: 與其買入門卡,不是用內顯就好? 27.52.134.40 01/02 07:56
Sartanis: VRAM入門感覺要12GB吧? 118.166.134.64 01/02 09:59
iorittn: 訓練模型要12g,畫圖不用 223.138.55.131 01/02 13:49