→ allyourshit : 瓶頸一直是在IO啊 04/20 00:13
→ kira925 : 反正瓶頸一直都是IO... 04/20 00:23
我的IO指的是硬體處理IO的效率變差了
目前瓶頸是處理IO的cpu能力吧
還是我理解錯了?
推 flylee : Xeon 每一核的L3快取大概是1MB04/20 00:25
→ flylee : 聽說 Zen2 平均每一核是4MB L3快取04/20 00:25
→ flylee : 多塞 L3快取,減少 DDR的存取04/20 00:26
可是L3是同一node裡面所有核心共享
核心數一多不會有效能議題嗎
→ cn201 : 但是skylake-sp因為架構的關係資料其實是直接從L2撈04/20 00:29
→ cn201 : 所以L3才沒這麼大,只是這個更改感覺沒有什麼太多的04/20 00:29
→ cn201 : 益處04/20 00:29
推 a2935373 : Datacenter瓶頸一直卡在RAM上面吧....04/20 00:30
目前在10G以上的網路環境 IO處理一直是最大的議題喔
※ 編輯: w180112 (36.224.2.241), 04/20/2019 00:51:45
推 atrix : 不是,錢才是04/20 01:01
推 a2935373 : 對啊,資料幾乎都要從RAM撈 後端LAN問題又另一回事04/20 01:04
→ allyourshit : 你先去研究一下熔斷那些bug吧 I家為了加速IO搞的事 04/20 01:18
推 tonyselina : 假設在成本考量小於效能考量 ->這句就不成立阿 04/20 01:18
→ allyourshit : fix bug之後 I家IO直接降低30%效能 04/20 01:18
→ tonyselina : 資料中心最重要就是便宜大量好布置出錯能馬上替換04/20 01:20
推 wei115 : 夠便宜 IO延遲又在合理範圍 還是會採用八 重新擬定04/20 01:42
→ wei115 : 軟體最佳化 來避免IO瓶頸04/20 01:43
軟體最佳化還是有天花板啊
現有方案也就那幾項
Intel玩的也很兇
推 b325019 : 反正intel打完patch也沒io優勢了(X04/20 01:51
之前實作軟體時有用到branch prediction相關功能
看到那個bug臉都綠了
推 a2935373 : 本來的作法也不一定比較快 你很難不跨DIE04/20 02:04
→ jior : 我覺得這只有對一般PC有差說,一般PC也許原生會比c 04/20 02:31
→ jior : hiplet好 04/20 02:31
噓 xu3fu6xup6 : io瓶頸不是cpu好嗎 04/20 02:42
→ xu3fu6xup6 : 去重修計算機組織04/20 02:42
還是你要我說OS?
要認真講可以啊 講cpu只是概略而已
難道要打幾百字?
搞相關實作也好一陣子了還被叫回去修計組真的笑死
→ jeff40108 : 嗯其實那顆IO die包含ram controller04/20 02:54
了解
→ enjoyself : 假設成本考量小於效能考量?? 這啥鬼啊~~04/20 03:14
→ enjoyself : 拜託~~幫幫忙,資料中心絕對不是打電動看世界~~ 04/20 03:16
我現在工作就是在搞資料中心相關啊...
只是是偏軟體相關而已
→ enjoyself : 難道還加裝rgb led 潮燈條~~ 04/20 03:18
※ 編輯: w180112 (36.224.2.241), 04/20/2019 03:30:08
推 b325019 : ZEN架構當時的問題是跨die存取ram跟人家跨socket一 04/20 04:40
→ b325019 : 樣所以這代改這樣後最少同socket存取ram不會有落差 04/20 04:40
→ b325019 : 在軟體優化會比較簡單整體來說IO應該會比前代好 04/20 04:40
推 twlin : data/IC/Tlb prefetch, memory rename, write combi 04/20 06:23
→ twlin : nation, dram open/close page prediction...很多機 04/20 06:23
→ twlin : 制都可以減少記憶體延遲的影響 04/20 06:23
推 waiter337 : 成本 效能 電費 良率 溫度 bug 還有啥沒講到 04/20 10:11
推 galactic : 時間取決一切 04/20 11:53
→ eva19452002 : 重點是這世界上不存在成本考量小於效能考量這件事 04/20 12:22
→ kuma660224 : 要考慮快取架構與效率問題,吸收多少io需求 04/20 12:48
→ friedpig : 成本跟效能不是一體兩面的東西 怎麼會拖勾考慮 單 04/20 13:11
→ friedpig : 體效能輸 但賣便宜 直接靠量補 這不就現在在玩的方 04/20 13:11
→ friedpig : 式 04/20 13:11
→ friedpig : 當然成本算的是整體配套成本不是單看單一硬體 靠量 04/20 13:14
→ friedpig : 勢必周邊的成本會增加 還有後續軟體資源跟fae協助 04/20 13:14
→ friedpig : 都是成本的一環 04/20 13:14
推 dabochi : 理論上同一個封裝內的晶片間互連 IO延遲不應該高於 04/20 16:13
→ dabochi : Socket間互聯 因此如果今天能夠用一半甚至更少的 04/20 16:15
→ dabochi : Socket就提供相等且效能大致相等的核心數 04/20 16:16
→ dabochi : 那麼改用獨立但In Package的IO晶片就值得了 而且這 04/20 16:18
→ dabochi : 麽一來 Socket變少也會在Fabric/Layout上提供相對 04/20 16:20
→ kuma660224 : 其實IO主要是頻寬要大,延遲被三層快取吸收 04/20 16:26
→ dabochi : 精簡的優勢 更不用說如果有天NVDIMM普及了 也許還會 04/20 16:26
→ kuma660224 : 若卡在延遲(cache miss)的機率不高 04/20 16:27
→ kuma660224 : IO擺獨立的Die應該沒明顯差異 04/20 16:27
→ dabochi : 有CPU-Storage直連的需求 改用獨立IO控制器的優勢 04/20 16:28
→ dabochi : 就會出現了...不過真的最後要說如果Zen是IBM/Intel 04/20 16:30
→ dabochi : 這兩個藍色的巨人出的 哪會發生In Package的延遲跟 04/20 16:31
→ dabochi : Socket間差不多的神奇事 04/20 16:31
→ friedpig : 還真別說 之前就真的這麼慘 同個封裝還輸socket對連 04/20 16:42
→ friedpig : 不過這代改架構應該不會出這種怪事了 04/20 16:42
推 kuninaka : 跨chiplet或跨socket的差別吧 04/20 17:03
推 a2935373 : EPYC1真的跨die和跨socket差不多慢 04/20 19:17
推 hcwang1126 : Intel NVDIMM 就直接衝DAX mode 04/20 19:27
→ hcwang1126 : 不過不可能給AMD用就是 04/20 19:28