看板 hardware 關於我們 聯絡資訊
※ 引述《oijkue (中肯!! (鄉民調))》之銘言: : -- : ※ 發信站: 批踢踢實業坊(ptt.cc) : ◆ From: 219.84.132.86 : 推 Kent:謠言本部若講的是真的 netburst p4身價暴跌時間就快了 02/06 20:47 : 推 oijkue:這應該還好,有些工作還是要高時脈的cpu才比較適合 02/06 20:49 sorry 我現在還是對這樣的說法不以為然 其實 CPU 的時脈 只要 clock generator 能產生 理論上要多高就可以多高 只是 function unit 不一定跟得上 所以時脈不代表效能 為什麼 P4 在轉碼工作上的表現 一般而言會比 K8 或 P-M 還快呢 絕對不是單純因為他的時脈高 最重要的是他的浮點運算元是實在的 128bit 理論上一個 cycle 就可以處理四個 single precision float 這在大量用 SSE 最佳化的轉碼軟體上會非常有利 反觀 K8 的運算元只有 80bit 因此需要兩個 cycle 才能處理相同的動作 用 Sandra 裡面的 multimedia benchmark 就可以輕易確認這個事實 但為什麼許多浮點運算還是 K8 勝出? 因為用 SSE 把所有浮點運算向量化是非常不容易的工作 現在的 compiler 幾乎都無法做到 (除非你用 intel 的 compiler) 所以一般的浮點運算中 K8 的 80bit 運算元已經夠用了 至於 P-M 則是敗在它的 instruction decoder 雖然有三組 卻只有一組能處理 SSE/SSE2 instruction 就像一個老饕 雖然吃東西很快 但如果上菜速度很慢 他還是只能細嚼慢嚥一般 事實上 這些用 SSE 最佳化的工作 通常都屬於 stream processing 的範疇 如果可以在 GPU 上實作 理論上效能可以輕易超過 CPU 別忘了 GPU 的時脈是遠遠落後 CPU 的 (600 MHz算是很高了) -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 220.140.43.194 ※ 編輯: littleshan 來自: 220.140.43.194 (02/06 22:22)
milen:快了...PCI-E的下傳頻寬夠大...看那時要寫出軟體來 02/06 22:29
oijkue:謝謝指教 希望Conroe能夠具備兩者的優點 02/06 22:30
cutemaumau:大推 很詳細 02/06 22:44
mestelqure:好文推!! 02/06 23:47