作者Instance (呆呆華)
看板C_and_CPP
標題[心得] X86 架構下的 Memory Model
時間Sun Jul 18 11:24:10 2021
大多時間在家有點無聊,花了點時間研究以前一知半解的東西。
不過要強調的是,這篇文章只針對 X86。
std::atomic 有六種 Memory Order 選項:
memory_order_relaxed,
memory_order_consume,
memory_order_acquire,
memory_order_release,
memory_order_acq_rel,
memory_order_seq_cst
這六種模式在 X86 底下幾乎沒什麼差別的,
用最弱的 memory_order_relaxed 就可以了,
因為 X86 是屬於 Strong Memory Model 的架構。
Load-Load, Store-Store, Load-Store 情況下是安全的。
Store-Load 情況下表示,
A 執行緒儲存某一變數,
其他執行緒必須同步讀到最新的數值,
這時就必須用到原子操作。
如果要理解原子操作的話,
最簡單的方法是從硬體角度來思考。
現代的 CPU 有 L1, L2, L3 Cache,
如果你的電腦有多個核心,
當資料放在 L1, L2 Cache 時,
並不保證所有核心對某一變數的值是一致的。
而進行原子操作的動作之後,
變數的值會同步到所有核心的 Cache。
原子操作的方法有很多種:
1. std::atomic<int> x;
2. std::atomic_thread_fence(std::memory_order_relaxed);
3. asm volatile("mfence" ::: "memory"); // 組合語言
4. asm volatile("lock; addl $0,0(%%rsp)" ::: "memory", "cc"); // 好像是更快的組合
語言,我不是很了解
5. InterlockedExchange(); // Win API
效果都是將變數的值同步到所有核心,
這樣才能保證多執行緒環境下此變數的全局可見,
Win API 或許效能會稍差一點吧。
參考文章:
C++11中的內存模型上篇 - 內存模型基礎
https://tinyurl.com/f36rsus9
C++11中的內存模型下篇 - C++11支持的幾種內存模型
https://tinyurl.com/95e33cf5
X86/GCC memory fence的一些見解
https://zhuanlan.zhihu.com/p/41872203
--
西之西處,大陸彼岸,我族飛舞,乘馭他風...
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.241.208.49 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/C_and_CPP/M.1626578713.A.0AC.html
→ sarafciel: 呃...我建議原PO去補一下圖靈獎神書計算機架構 07/18 22:36
→ sarafciel: 你這篇文章從原子操作開始的東西除了參考應該都是錯的 07/18 22:40
不是很懂,哪裡有問題在請S大詳述一下,方便後進們學習。
→ final01: 有書在講這個??好像都是網路文章吧?所以很片段XD 07/18 23:11
→ sarafciel: CA也不是專門講這個的書啦XD 但是要理解這部分issue 07/18 23:25
→ sarafciel: 對CPU的設計跟加速原理要有一定程度的認識 07/18 23:26
推 poyenc: 好奇你怎麼不看 Hans-J. Boehm 的提案還有論文, 而是看網 07/19 02:10
→ poyenc: 路上的文章 07/19 02:10
※ 編輯: Instance (118.167.163.61 臺灣), 07/19/2021 11:51:35
噓 EricTCartman: 好奇要是一開始就知道要看Boehm的論文還會願意發文 07/19 17:39
→ EricTCartman: 給樓上酸? 07/19 17:40
→ Caesar08: 樓上,這也不是甚麼很神秘的資訊,google memory order 07/20 01:28
→ Caesar08: 上面就有寫每一個的內容是甚麼。看不懂也有spec可以讀 07/20 01:30