看板 PC_Shopping 關於我們 聯絡資訊
※ 引述《kuankubank ( )》之銘言: : 將CPU核心與IO核心獨立,Rome處理器實際上是8組CPU核心+1組IO核心組成。 : AMD這種模組化晶片在延遲上不如原生多核心,但好處還是太多了,製造難度 : 大幅下降,良率大幅提升。 : 這種chiplets設計會越來越流行,它可以靈活搭配不同製程、不同架構的晶片, : 代價是延遲會有所增加,但是與獲得的好處相比依然是值得的,因為製造多個 : 小核心晶片的難度要比製造原生多核心的晶片低多了,良率會大幅提升,進而控制成本 。 我比較好奇的是 這樣的IO延遲到底值不值得 假設在成本考量小於效能考量的時候 資料中心會怎麼選 現在資料中心搭配虛擬化的前提是IO要快 如果IO都慢了 那核心多的好處還有嗎 因為瓶頸就又跑回去IO了? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.224.2.241 ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1555690312.A.C56.html
allyourshit : 瓶頸一直是在IO啊 04/20 00:13
kira925 : 反正瓶頸一直都是IO... 04/20 00:23
我的IO指的是硬體處理IO的效率變差了 目前瓶頸是處理IO的cpu能力吧 還是我理解錯了?
flylee : Xeon 每一核的L3快取大概是1MB04/20 00:25
flylee : 聽說 Zen2 平均每一核是4MB L3快取04/20 00:25
flylee : 多塞 L3快取,減少 DDR的存取04/20 00:26
可是L3是同一node裡面所有核心共享 核心數一多不會有效能議題嗎
cn201 : 但是skylake-sp因為架構的關係資料其實是直接從L2撈04/20 00:29
cn201 : 所以L3才沒這麼大,只是這個更改感覺沒有什麼太多的04/20 00:29
cn201 : 益處04/20 00:29
a2935373 : Datacenter瓶頸一直卡在RAM上面吧....04/20 00:30
目前在10G以上的網路環境 IO處理一直是最大的議題喔 ※ 編輯: w180112 (36.224.2.241), 04/20/2019 00:51:45
atrix : 不是,錢才是04/20 01:01
a2935373 : 對啊,資料幾乎都要從RAM撈 後端LAN問題又另一回事04/20 01:04
allyourshit : 你先去研究一下熔斷那些bug吧 I家為了加速IO搞的事 04/20 01:18
tonyselina : 假設在成本考量小於效能考量 ->這句就不成立阿 04/20 01:18
allyourshit : fix bug之後 I家IO直接降低30%效能 04/20 01:18
tonyselina : 資料中心最重要就是便宜大量好布置出錯能馬上替換04/20 01:20
wei115 : 夠便宜 IO延遲又在合理範圍 還是會採用八 重新擬定04/20 01:42
wei115 : 軟體最佳化 來避免IO瓶頸04/20 01:43
軟體最佳化還是有天花板啊 現有方案也就那幾項 Intel玩的也很兇
b325019 : 反正intel打完patch也沒io優勢了(X04/20 01:51
之前實作軟體時有用到branch prediction相關功能 看到那個bug臉都綠了
a2935373 : 本來的作法也不一定比較快 你很難不跨DIE04/20 02:04
jior : 我覺得這只有對一般PC有差說,一般PC也許原生會比c 04/20 02:31
jior : hiplet好 04/20 02:31
xu3fu6xup6 : io瓶頸不是cpu好嗎 04/20 02:42
xu3fu6xup6 : 去重修計算機組織04/20 02:42
還是你要我說OS? 要認真講可以啊 講cpu只是概略而已 難道要打幾百字? 搞相關實作也好一陣子了還被叫回去修計組真的笑死
jeff40108 : 嗯其實那顆IO die包含ram controller04/20 02:54
了解
enjoyself : 假設成本考量小於效能考量?? 這啥鬼啊~~04/20 03:14
enjoyself : 拜託~~幫幫忙,資料中心絕對不是打電動看世界~~ 04/20 03:16
我現在工作就是在搞資料中心相關啊... 只是是偏軟體相關而已
enjoyself : 難道還加裝rgb led 潮燈條~~ 04/20 03:18
※ 編輯: w180112 (36.224.2.241), 04/20/2019 03:30:08
b325019 : ZEN架構當時的問題是跨die存取ram跟人家跨socket一 04/20 04:40
b325019 : 樣所以這代改這樣後最少同socket存取ram不會有落差 04/20 04:40
b325019 : 在軟體優化會比較簡單整體來說IO應該會比前代好 04/20 04:40
twlin : data/IC/Tlb prefetch, memory rename, write combi 04/20 06:23
twlin : nation, dram open/close page prediction...很多機 04/20 06:23
twlin : 制都可以減少記憶體延遲的影響 04/20 06:23
waiter337 : 成本 效能 電費 良率 溫度 bug 還有啥沒講到 04/20 10:11
galactic : 時間取決一切 04/20 11:53
eva19452002 : 重點是這世界上不存在成本考量小於效能考量這件事 04/20 12:22
kuma660224 : 要考慮快取架構與效率問題,吸收多少io需求 04/20 12:48
friedpig : 成本跟效能不是一體兩面的東西 怎麼會拖勾考慮 單 04/20 13:11
friedpig : 體效能輸 但賣便宜 直接靠量補 這不就現在在玩的方 04/20 13:11
friedpig : 式 04/20 13:11
friedpig : 當然成本算的是整體配套成本不是單看單一硬體 靠量 04/20 13:14
friedpig : 勢必周邊的成本會增加 還有後續軟體資源跟fae協助 04/20 13:14
friedpig : 都是成本的一環 04/20 13:14
dabochi : 理論上同一個封裝內的晶片間互連 IO延遲不應該高於 04/20 16:13
dabochi : Socket間互聯 因此如果今天能夠用一半甚至更少的 04/20 16:15
dabochi : Socket就提供相等且效能大致相等的核心數 04/20 16:16
dabochi : 那麼改用獨立但In Package的IO晶片就值得了 而且這 04/20 16:18
dabochi : 麽一來 Socket變少也會在Fabric/Layout上提供相對 04/20 16:20
kuma660224 : 其實IO主要是頻寬要大,延遲被三層快取吸收 04/20 16:26
dabochi : 精簡的優勢 更不用說如果有天NVDIMM普及了 也許還會 04/20 16:26
kuma660224 : 若卡在延遲(cache miss)的機率不高 04/20 16:27
kuma660224 : IO擺獨立的Die應該沒明顯差異 04/20 16:27
dabochi : 有CPU-Storage直連的需求 改用獨立IO控制器的優勢 04/20 16:28
dabochi : 就會出現了...不過真的最後要說如果Zen是IBM/Intel 04/20 16:30
dabochi : 這兩個藍色的巨人出的 哪會發生In Package的延遲跟 04/20 16:31
dabochi : Socket間差不多的神奇事 04/20 16:31
friedpig : 還真別說 之前就真的這麼慘 同個封裝還輸socket對連 04/20 16:42
friedpig : 不過這代改架構應該不會出這種怪事了 04/20 16:42
kuninaka : 跨chiplet或跨socket的差別吧 04/20 17:03
a2935373 : EPYC1真的跨die和跨socket差不多慢 04/20 19:17
hcwang1126 : Intel NVDIMM 就直接衝DAX mode 04/20 19:27
hcwang1126 : 不過不可能給AMD用就是 04/20 19:28