Re: [情報] 傳Zen2處理器良率超過70%：成本比Intel低

作者w180112 ([NOOB]我超RETARD我超廢 )

看板PC_Shopping

標題Re: [情報] 傳Zen2處理器良率超過70%：成本比Intel低

時間Sat Apr 20 00:11:50 2019

※ 引述《kuankubank ( )》之銘言： : 將CPU核心與IO核心獨立，Rome處理器實際上是8組CPU核心+1組IO核心組成。 : AMD這種模組化晶片在延遲上不如原生多核心，但好處還是太多了，製造難度 : 大幅下降，良率大幅提升。 : 這種chiplets設計會越來越流行，它可以靈活搭配不同製程、不同架構的晶片， : 代價是延遲會有所增加，但是與獲得的好處相比依然是值得的，因為製造多個 : 小核心晶片的難度要比製造原生多核心的晶片低多了，良率會大幅提升，進而控制成本。我比較好奇的是這樣的IO延遲到底值不值得假設在成本考量小於效能考量的時候資料中心會怎麼選現在資料中心搭配虛擬化的前提是IO要快如果IO都慢了那核心多的好處還有嗎因為瓶頸就又跑回去IO了？ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.224.2.241 ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1555690312.A.C56.html

→ allyourshit : 瓶頸一直是在IO啊 04/20 00:13

→ kira925 : 反正瓶頸一直都是IO... 04/20 00:23

我的IO指的是硬體處理IO的效率變差了目前瓶頸是處理IO的cpu能力吧還是我理解錯了？

推 flylee : Xeon 每一核的L3快取大概是1MB04/20 00:25

→ flylee : 聽說 Zen2 平均每一核是4MB L3快取04/20 00:25

→ flylee : 多塞 L3快取，減少 DDR的存取04/20 00:26

可是L3是同一node裡面所有核心共享核心數一多不會有效能議題嗎

→ cn201 : 但是skylake-sp因為架構的關係資料其實是直接從L2撈04/20 00:29

→ cn201 : 所以L3才沒這麼大，只是這個更改感覺沒有什麼太多的04/20 00:29

→ cn201 : 益處04/20 00:29

推 a2935373 : Datacenter瓶頸一直卡在RAM上面吧....04/20 00:30

目前在10G以上的網路環境 IO處理一直是最大的議題喔 ※ 編輯: w180112 (36.224.2.241), 04/20/2019 00:51:45

推 atrix : 不是，錢才是04/20 01:01

推 a2935373 : 對啊，資料幾乎都要從RAM撈後端LAN問題又另一回事04/20 01:04

→ allyourshit : 你先去研究一下熔斷那些bug吧 I家為了加速IO搞的事 04/20 01:18

推 tonyselina : 假設在成本考量小於效能考量 ->這句就不成立阿 04/20 01:18

→ allyourshit : fix bug之後 I家IO直接降低30%效能 04/20 01:18

→ tonyselina : 資料中心最重要就是便宜大量好布置出錯能馬上替換04/20 01:20

推 wei115 : 夠便宜 IO延遲又在合理範圍還是會採用八重新擬定04/20 01:42

→ wei115 : 軟體最佳化來避免IO瓶頸04/20 01:43

軟體最佳化還是有天花板啊現有方案也就那幾項 Intel玩的也很兇

推 b325019 : 反正intel打完patch也沒io優勢了(X04/20 01:51

之前實作軟體時有用到branch prediction相關功能看到那個bug臉都綠了

推 a2935373 : 本來的作法也不一定比較快你很難不跨DIE04/20 02:04

→ jior : 我覺得這只有對一般PC有差說，一般PC也許原生會比c 04/20 02:31

→ jior : hiplet好 04/20 02:31

噓 xu3fu6xup6 : io瓶頸不是cpu好嗎 04/20 02:42

→ xu3fu6xup6 : 去重修計算機組織04/20 02:42

還是你要我說OS？要認真講可以啊講cpu只是概略而已難道要打幾百字？搞相關實作也好一陣子了還被叫回去修計組真的笑死

→ jeff40108 : 嗯其實那顆IO die包含ram controller04/20 02:54

了解

→ enjoyself : 假設成本考量小於效能考量?? 這啥鬼啊~~04/20 03:14

→ enjoyself : 拜託~~幫幫忙，資料中心絕對不是打電動看世界~~ 04/20 03:16

我現在工作就是在搞資料中心相關啊... 只是是偏軟體相關而已

→ enjoyself : 難道還加裝rgb led 潮燈條~~ 04/20 03:18

※ 編輯: w180112 (36.224.2.241), 04/20/2019 03:30:08

推 b325019 : ZEN架構當時的問題是跨die存取ram跟人家跨socket一 04/20 04:40

→ b325019 : 樣所以這代改這樣後最少同socket存取ram不會有落差 04/20 04:40

→ b325019 : 在軟體優化會比較簡單整體來說IO應該會比前代好 04/20 04:40

推 twlin : data/IC/Tlb prefetch, memory rename, write combi 04/20 06:23

→ twlin : nation, dram open/close page prediction...很多機 04/20 06:23

→ twlin : 制都可以減少記憶體延遲的影響 04/20 06:23

推 waiter337 : 成本效能電費良率溫度 bug 還有啥沒講到 04/20 10:11

推 galactic : 時間取決一切 04/20 11:53

→ eva19452002 : 重點是這世界上不存在成本考量小於效能考量這件事 04/20 12:22

→ kuma660224 : 要考慮快取架構與效率問題，吸收多少io需求 04/20 12:48

→ friedpig : 成本跟效能不是一體兩面的東西怎麼會拖勾考慮單 04/20 13:11

→ friedpig : 體效能輸但賣便宜直接靠量補這不就現在在玩的方 04/20 13:11

→ friedpig : 式 04/20 13:11

→ friedpig : 當然成本算的是整體配套成本不是單看單一硬體靠量 04/20 13:14

→ friedpig : 勢必周邊的成本會增加還有後續軟體資源跟fae協助 04/20 13:14

→ friedpig : 都是成本的一環 04/20 13:14

推 dabochi : 理論上同一個封裝內的晶片間互連 IO延遲不應該高於 04/20 16:13

→ dabochi : Socket間互聯因此如果今天能夠用一半甚至更少的 04/20 16:15

→ dabochi : Socket就提供相等且效能大致相等的核心數 04/20 16:16

→ dabochi : 那麼改用獨立但In Package的IO晶片就值得了而且這 04/20 16:18

→ dabochi : 麽一來 Socket變少也會在Fabric/Layout上提供相對 04/20 16:20

→ kuma660224 : 其實IO主要是頻寬要大，延遲被三層快取吸收 04/20 16:26

→ dabochi : 精簡的優勢更不用說如果有天NVDIMM普及了也許還會 04/20 16:26

→ kuma660224 : 若卡在延遲（cache miss）的機率不高 04/20 16:27

→ kuma660224 : IO擺獨立的Die應該沒明顯差異 04/20 16:27

→ dabochi : 有CPU-Storage直連的需求改用獨立IO控制器的優勢 04/20 16:28

→ dabochi : 就會出現了...不過真的最後要說如果Zen是IBM/Intel 04/20 16:30

→ dabochi : 這兩個藍色的巨人出的哪會發生In Package的延遲跟 04/20 16:31

→ dabochi : Socket間差不多的神奇事 04/20 16:31

→ friedpig : 還真別說之前就真的這麼慘同個封裝還輸socket對連 04/20 16:42

→ friedpig : 不過這代改架構應該不會出這種怪事了 04/20 16:42

推 kuninaka : 跨chiplet或跨socket的差別吧 04/20 17:03

推 a2935373 : EPYC1真的跨die和跨socket差不多慢 04/20 19:17

推 hcwang1126 : Intel NVDIMM 就直接衝DAX mode 04/20 19:27

→ hcwang1126 : 不過不可能給AMD用就是 04/20 19:28