看板 C_and_CPP 關於我們 聯絡資訊
我的經驗是使用 cpu 做平行計算時, 應該盡量避免 atomic operation, 因為計算效率可以不會太好. 但當用 gpu 做平行計算, 這個經驗還可靠嗎?有沒有很容易因為計算單元超多, 而彌補了計算單元的等待時間? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.71.76.184 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_and_CPP/M.1653402904.A.82F.html
wulouise: 你想說的是lockless或不用atomic type? 05/24 23:57
eagle32: 望文生義猜測是lockless. 看了以下這篇討論,我想gpu 的 05/25 00:37
eagle32: atomic operation 應該跟cpu的表現不太一樣。 05/25 00:37
eagle32: ic-operations-on-global-memory-in-cuda-performed-in- 05/25 00:37
eagle32: parallel-across-a-wa 05/25 00:37
tinlans: 主要還是看處理器架構,有些架構可以選用不同 memory 05/25 02:20
tinlans: model 來避免效能損失太嚴重。 05/25 02:20
wulouise: gpu沒有人在同步資料的吧 都是算完一起拿回來 05/25 09:01
wulouise: 應該說要同步的話 那當初就不要用gpu 05/25 09:02
eagle32: 謝謝大家的回覆,還有很多技術細節不懂,因為時間有限, 05/26 11:28
eagle32: 還沒好好學習一下。 05/26 11:28
suspect1: 我猜指的是MCU的atomic instruction吧?為了微控制器在 06/17 20:10
suspect1: 處理重要任務時,為了防止其他硬體中斷的干擾,或是在多 06/17 20:11
suspect1: 執行緒下,Muti-threads彼此發生race condition 06/17 20:13
suspect1: 才會適度的使用atomic,但你也可以用semaphore、 06/17 20:15
suspect1: spin lock來處理。atomic 指令是在你執行保證不會被中斷 06/17 20:17
suspect1: 用GPU當然會計算速度當然遠大於MCU/CPU 因為本來就是 06/17 20:21
suspect1: 用來計算大量的矩陣運算的,要不然為什麼要買顯卡 06/17 20:23
suspect1: 顯卡來挖礦? 06/17 20:24