看板 C_and_CPP 關於我們 聯絡資訊
大多時間在家有點無聊,花了點時間研究以前一知半解的東西。 不過要強調的是,這篇文章只針對 X86。 std::atomic 有六種 Memory Order 選項: memory_order_relaxed, memory_order_consume, memory_order_acquire, memory_order_release, memory_order_acq_rel, memory_order_seq_cst 這六種模式在 X86 底下幾乎沒什麼差別的, 用最弱的 memory_order_relaxed 就可以了, 因為 X86 是屬於 Strong Memory Model 的架構。 Load-Load, Store-Store, Load-Store 情況下是安全的。 Store-Load 情況下表示, A 執行緒儲存某一變數, 其他執行緒必須同步讀到最新的數值, 這時就必須用到原子操作。 如果要理解原子操作的話, 最簡單的方法是從硬體角度來思考。 現代的 CPU 有 L1, L2, L3 Cache, 如果你的電腦有多個核心, 當資料放在 L1, L2 Cache 時, 並不保證所有核心對某一變數的值是一致的。 而進行原子操作的動作之後, 變數的值會同步到所有核心的 Cache。 原子操作的方法有很多種: 1. std::atomic<int> x; 2. std::atomic_thread_fence(std::memory_order_relaxed); 3. asm volatile("mfence" ::: "memory"); // 組合語言 4. asm volatile("lock; addl $0,0(%%rsp)" ::: "memory", "cc"); // 好像是更快的組合 語言,我不是很了解 5. InterlockedExchange(); // Win API 效果都是將變數的值同步到所有核心, 這樣才能保證多執行緒環境下此變數的全局可見, Win API 或許效能會稍差一點吧。 參考文章: C++11中的內存模型上篇 - 內存模型基礎 https://tinyurl.com/f36rsus9 C++11中的內存模型下篇 - C++11支持的幾種內存模型 https://tinyurl.com/95e33cf5 X86/GCC memory fence的一些見解 https://zhuanlan.zhihu.com/p/41872203 -- 西之西處,大陸彼岸,我族飛舞,乘馭他風... -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.241.208.49 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_and_CPP/M.1626578713.A.0AC.html
sarafciel: 呃...我建議原PO去補一下圖靈獎神書計算機架構 07/18 22:36
sarafciel: 你這篇文章從原子操作開始的東西除了參考應該都是錯的 07/18 22:40
不是很懂,哪裡有問題在請S大詳述一下,方便後進們學習。
final01: 有書在講這個??好像都是網路文章吧?所以很片段XD 07/18 23:11
sarafciel: CA也不是專門講這個的書啦XD 但是要理解這部分issue 07/18 23:25
sarafciel: 對CPU的設計跟加速原理要有一定程度的認識 07/18 23:26
poyenc: 好奇你怎麼不看 Hans-J. Boehm 的提案還有論文, 而是看網 07/19 02:10
poyenc: 路上的文章 07/19 02:10
※ 編輯: Instance (118.167.163.61 臺灣), 07/19/2021 11:51:35
EricTCartman: 好奇要是一開始就知道要看Boehm的論文還會願意發文 07/19 17:39
EricTCartman: 給樓上酸? 07/19 17:40
Caesar08: 樓上,這也不是甚麼很神秘的資訊,google memory order 07/20 01:28
Caesar08: 上面就有寫每一個的內容是甚麼。看不懂也有spec可以讀 07/20 01:30