[問題] atomic operation 與 計算效率問題

作者eagle32 (バスケがしたいです)

看板C_and_CPP

標題[問題] atomic operation 與計算效率問題

時間Tue May 24 22:35:02 2022

我的經驗是使用 cpu 做平行計算時, 應該盡量避免 atomic operation, 因為計算效率可以不會太好. 但當用 gpu 做平行計算, 這個經驗還可靠嗎？有沒有很容易因為計算單元超多, 而彌補了計算單元的等待時間？ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.71.76.184 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_and_CPP/M.1653402904.A.82F.html

推 wulouise: 你想說的是lockless或不用atomic type? 05/24 23:57

→ eagle32: 望文生義猜測是lockless. 看了以下這篇討論，我想gpu 的 05/25 00:37

→ eagle32: atomic operation 應該跟cpu的表現不太一樣。 05/25 00:37

→ eagle32: https://stackoverflow.com/questions/3148345/are-atom 05/25 00:37

→ eagle32: ic-operations-on-global-memory-in-cuda-performed-in- 05/25 00:37

→ eagle32: parallel-across-a-wa 05/25 00:37

→ tinlans: 主要還是看處理器架構，有些架構可以選用不同 memory 05/25 02:20

→ tinlans: model 來避免效能損失太嚴重。 05/25 02:20

推 wulouise: gpu沒有人在同步資料的吧都是算完一起拿回來 05/25 09:01

→ wulouise: 應該說要同步的話那當初就不要用gpu 05/25 09:02

→ eagle32: 謝謝大家的回覆，還有很多技術細節不懂，因為時間有限， 05/26 11:28

→ eagle32: 還沒好好學習一下。 05/26 11:28

推 suspect1: 我猜指的是MCU的atomic instruction吧？為了微控制器在 06/17 20:10

→ suspect1: 處理重要任務時，為了防止其他硬體中斷的干擾，或是在多 06/17 20:11

→ suspect1: 執行緒下，Muti-threads彼此發生race condition 06/17 20:13

→ suspect1: 才會適度的使用atomic，但你也可以用semaphore、 06/17 20:15

→ suspect1: spin lock來處理。atomic 指令是在你執行保證不會被中斷 06/17 20:17

推 suspect1: 用GPU當然會計算速度當然遠大於MCU/CPU 因為本來就是 06/17 20:21

→ suspect1: 用來計算大量的矩陣運算的，要不然為什麼要買顯卡 06/17 20:23

→ suspect1: 顯卡來挖礦？ 06/17 20:24