[轉錄]Re: [問卦] 有沒有AMD的八卦

作者philipwen (匈牙利=Hungary)

看板PDA

標題[轉錄]Re: [問卦] 有沒有AMD的八卦

時間Sat Aug 1 11:46:04 2009

※ [本文轉錄自 Gossiping 看板] 作者: sitos (麥子) 看板: Gossiping 標題: Re: [問卦] 有沒有AMD的八卦時間: Fri Jul 31 02:19:33 2009 ※ 引述《SkyElder (不可有一絲惡念)》之銘言： : AMD最近真的是被打假的多核心同時脈效能都輸30%左右 : 應該不是說最近 : 應該說兩年有了 : 更久以前AMD的同時脈效能是領先INTEL的也就是說如果同樣是跑2G : AMD效能硬是比較快所以他才出了一堆類似型號是3500結果實際時脈只跑2.2G : 玩這種把戲就是宣稱自己的2.2G可以跑得跟INTEL的3.5G一樣快 : 事實上是沒有一樣快可是也差不多了 intel 在 p2~p4 的時期，應該都還算是在衝 clock rate ，要把 clock rate 衝上去的方法就是讓每一個 pipeline stage 更短，當然相對地，做完一件事的時間需求一樣， pipeline 的深度就會變深。透過這樣的方式，可以很漂亮地讓 clock rate 衝上去。當時的市場看到 clock rate 就爽了，爽大家就買，效能進步其實未必很大。 pipeline 當然是增加 instruction level parallelism 的好方法，至少課本都是這樣教的，適當地去切 pipeline 其實表現也都不錯。不過 intel 把這個觀念玩到極致，或者說是有點過頭了。一般課本會教的大概是 5~6 stage 的 pipeline ， intel 切到後來大概切到 20~30 個 stage 。如果程式的 instruction 之間真的都是 independent ，那麼 20~30 stage 的 pipeline 效能應該會還滿不錯的。但是因為一些 data/control dependency ，導致前後的 instruction 其實要互等， pipeline 執行常常在 stall 。切了一堆 stage ，但大家都在 idle ，對效能根本沒幫助。更慘的是，這些在 idle 的 unit 還是很認真地在等工作，所以繼續在耗電，這種爛方法搞到後來就是出現像 pentium D 這種，又吃電又熱跑起來又不怎麼快的 cpu 。 intel 自己也知道這樣不行了，因為這樣搞下去 power 都快要比 cpu 還要貴了。所以才換個方向，走向 pipeline 比較不那麼深的設計方式。早年 amd 用的策略就是跟 intel 不一樣，沒有強加 pipeline stage 。所以才會有所謂「同時脈」比較快，但基本上同時脈沒什麼意義，時脈本來就是看你在一個 cycle 要做多少事來決定的。 intel cpu 一個 cycle 做的事比較少，所以要用比較多的 cycle 才做完。 amd 則反過來。但基本上做完一件事所需要的時間差不了太多。真正決勝的點還是每一個 function unit 本身的設計，不過這些東西使用者是看不到的。 : CPU要快除了時脈以外最重要的就是內部的構造與技術時脈並不是關鍵 : 但近來INTEL出了新核心(從core 2技術開始) 用了新技術把整個局勢扭轉過來了 : 也就是說同時脈下效能會贏AMD 30%左右 : 又 INTEL製程比較先進比如INTEL 是45奈米但AMD只有65奈米 : 45奈米在相同時脈下比65奈米省電1/3 當然溫度也低 : 速度也會增快(因為電路間隙縮短傳遞更快) 其實前陣子 core/core2 把 amd 搞得很慘的原因除了製程，還有很重要的是 intel 有把兩個 die 放在同一個 package 裡面的能力。也就是所謂的非原生雙核心/四核心。當出 amd 在廣告上面嗆 intel 不是原生四核。不過就是因為不是原生四核，所以四核需要的是兩個小 die 不是一個大 die ， die 的成本和面積平方成正比，拆開來作就便宜多了。再加上非原生四核的缺點主要是差在 core-to-core 的溝通上面。不過一來是實際使用平行程式的使用者不多，未必感受得到差異。二來是，管理作得好一點，差別也沒有真的太多。而可憐的 amd 因為沒有這種技術，所以硬要一次作四核，在製造過程中要保證一整個大的 die 都是好的，成本就上去了。賣得貴又跑得沒快多少，誰要跟你買。 XD 有人說 amd 搞三核心就是為了壓低售價，只壞掉一個核心的還是可以拿來賣。不過我沒有去看過 spec ，不知道是不是真的這樣搞。因為那麼產品連我的好奇心都沒挑起來。 : AMD最近完全是靠顯示卡在撐 : AMD(ATI)的顯示卡蠻威的 : 雖然我用INETL的四核但我買AMD的顯示卡 : ATI的顯卡最近很威具有高CP值與高畫質把Geforce整個打趴了事實上再過一陣子， amd 可能都還是得要靠 gpu 來撐。依照目前 gpgpu (general purpose gpu)的發展來看，獨佔鰲頭的應該是 nvidia 的 cuda 。但是 cuda 架構有一個很大的缺陷，因為 cuda 在運算的時候，資料和程式都必須要放在 gpu 的記憶體裡面，雖然 size 也是問題，但不是最大的問題。最大的問題在於這些程式和資料，必須要先從 main memory 搬到 gpu memory 上面。而算完之後，還要從 gpu memory 再搬回 main memory 。很多不是真的計算量很大的程式，搬的時間就比算的時間還久。這種程式用 cuda 不會有加速的效果。因此可能的方向應該是要讓 gpu 也可以存取 main memory 。早先的 intel system 是把 memory controller 放在 north bridge 上面，可行的作法是把 gpu 也放在 north bridge 上面。以前內建顯卡有的就這樣做，然後扣掉一點 main memory 的大小。如果這塊不是被「切出去」，而是共享。那麼就可以讓 gpu 不用花額外的時間去「搬」資料。但是 intel 不太可能讓 nvidia 染指自家的 north bridge ，不管是專利或是介面， nvidia 作為 intel 主要對手之一，合作是要很小心的。而現在這個可能性又更小了，因為從 core i7 之後， memory controller 已經做在 cpu 裡面。事實上先這樣做的是 amd ，但這只是設計的決策不同， intel cpu 現在才有這個需求，所以現在才作這種整合。那麼 intel cpu 更不可能跟 nvidia gpu 做在一起。所以 intel 只能期待自己的 gpgpu 可以跟上 nvidia 跟 ati 。那東西的名字是 larrabee ，但現在看起來跟一般的 cpu 還差得遠。 (詳細的資料可以查 wikipedia 或 google 一下，很有趣的是它是一個用 x86 instruction set 的 gpu) 而 amd 的好處是有了 ati 的技術，可以把 cpu/gpu 做在同一塊 die 上。 cpu 輸 intel 一點， gpu 跟 nvidia 不相上下或再好一點。透過可以 share main memory ，省去資料搬移的時間，會讓 gpgpu 的應用更有吸引力， overhead 變少， performance 就出來了。相較於 nvidia 提出 cuda 的架構， amd/intel 之後應該會 follow OpenCL 的規範。不過目前還不是很具體，但希望未來是有一個統一 cpu/gpu 的 programming model 。也就是寫一份程式，自動會把工作分散到 cpu/gpu 讓它們協同工作，以達到更好的效能。至少在這一塊未來的發展上面， amd/ati 是很值得期待的，現在就看看 intel 在 gpu/gpgpu 這一塊要拿出什麼來應對。在 gpp (general purpose processor) 上面 intel 已經超強了， amd 快要不足以被當作對手。不過在 gpu/gpgpu 上面還很嫩。 amd 這塊如果能加緊腳步應該還滿有機會的，不過目前看起來有點.... 該怎麼說呢? 口號喊了一兩年，東西卻沒做出來半個，讓人滿擔心的。 (不過 intel 的 larrabee 也是喊了好一陣子，效能一直長不太出來。 XD 補一下好了，講錯就請糾正。這些東西在頭腦裡都揪成一沱了... -- 活著的目的是為主活然後為主死死亡的目的是為主死然後為主活 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 60.248.178.71

→ gg123sf:計組計結魂!! 07/31 02:20

→ gg123sf:其實clock rate衝高系統反而容易掛現在主戰場是分工合作 07/31 02:21

我不太確定你說的容易掛指的是哪個部份。如果單純是同一種架構， clock rate 高的確可能會因為 technology variation 造成訊號錯誤的情況。降頻一下，等訊號穩定再讀就沒問題了。 :) 分工合作的部份我猜你是說用特殊的指令集或 function unit 來加速。這部份也是做得.... 我個人覺得有點過火了 XD MMX/SSE/SSE2 之後來有一個什麼來著的... 忘了。雖然都是 x86 ，但多出來的東西，舊的機器可是一概不支援的。

→ a0801284545:太專業看無 07/31 02:22

推 sunsonsam:原來clock rate跟pipeline有關聯..................... 07/31 02:23

推 magecandy:半吊子鄉民:你幹嘛講話不用中文好好講要夾一堆英文? 07/31 02:23

推 zoo3021515:專業推 07/31 02:24

→ cloud7515:8核心！　INTEL：我多你八核心 07/31 02:24

推 autoupdate:用中文講五樓也是看不懂 07/31 02:24

→ sidi:好我看懂一個時脈這樣可以了可以了吧 07/31 02:24

推 ruemann:他用的英文還可以啦，只是北橋用英文會比較好？ 07/31 02:24

抱歉，也許用北橋講就好了。 :)

推 dingyuchi:推一下這篇應該要給M 07/31 02:24

→ feizizi:你會不會太猛了啊??? 連GPU你都能投頭是道拜服啊 07/31 02:25

推 GTOKevin:專業推 07/31 02:25

推 captdavince:推啊~接下來就是整合cpu和gpu在同一塊上了吧 07/31 02:26

推 pdaer:越跑越快越跑越吃電以後玩遊戲耗電量跟煮火鍋一樣了 07/31 02:26

要記得買電扇...

推 ruemann:cpu整合gpu……有應用再說吧，m$不支援api的話，就沒用了 07/31 02:27

已經有應用了阿。可以到 nvidia 的網站上面找 CUDA 。如果你有 8400 以上的板子就有支援，可以跑跑它的 demo 程式。 (當然要裝一些 nvidia 提供的軟體) 會比用 cpu 跑快非常非常多。而且開發介面也可以跟 vs 整合在一起， m$ 沒道理去擋這東西，對他們一點壞處也沒有。 :) ※ 編輯: sitos 來自: 60.248.178.71 (07/31 02:31)

推 sunsonsam:不太懂時脈跟管線深度有什麼關係時脈不是震盪器給的嗎 07/31 02:27

時脈的極限是來自於一個邏輯電路的訊號多久穩定到可以被讀出來，而訊號穩定取決於線路的長度還有一些設計相關的參數，我不是做 EDA 的，所以細節不是非常清楚。用一個過度簡化(不真實)的講法來講，假設你要做的事情有五件事，每一件事要做一秒，你五件事永遠要一起做，你就是要花五秒才能做完一件事。而且因為五件事都一定要一起做，所以同時也只能做其中的某一件。如果你可以把五件事拆開給五個人做，每一個人做一件事，就只需要一秒。第一個人做完，就把事情交接給第二個人，他又可以再去做另一件事。而這時候，我們可以把交接想像成一個檢查點，也就是一個時脈週期。所以，事情拆得越散，做完「一件」需要的時間就越短，時脈就可以越高。大致上的概念是這樣子，實作上當然還有很多其它需要考量的問題。英文用少一點會比較好嗎 :)

推 OpenGoodHate:底層達人出沒請小心 07/31 02:28

→ feizizi:八卦就是要有這種水準的文章才high啊~~~ XDDDDDDD 07/31 02:28

推 reallocust:4850的GPU已經夠拿來煮火鍋了...(X的,現在房間超熱的) 07/31 02:28

推 mike1990:看完了還是看的懂耶呵呵 07/31 02:29

推 fin806:GPU->CPU山寨板比CPU威還可以煮火鍋 07/31 02:29

→ OpenGoodHate:22台i7+GTX275 開下去冷氣會滴水 07/31 02:30

→ kslman:下次整篇英文才不會被酸 07/31 02:30

推 allen7976:I 怎麼都 watch 不懂... 07/31 02:30

推 AAAA:很多東西翻成中文反而會更不順 07/31 02:30

推 eric93: 07/31 02:30

推 HornyDragon:酸的人可以把這篇的英文都翻成中文試試看...... 07/31 02:30

推 skciv:白算盤 07/31 02:31

→ OpenGoodHate:GPU有自己的核心，記憶體跟板子，但是還不能宣佈獨立 07/31 02:31

※ 編輯: sitos 來自: 60.248.178.71 (07/31 02:35)

推 ikari512:推 autoupdate:用中文講五樓也是看不懂 07/31 02:32

推 asgard1991:只能推了囧"> 07/31 02:32

推 leopastiom:趕快推不然人家以為你看不懂!!!!!!!!!!!!!!!!!!!! 07/31 02:32

→ ikari512:不然5F翻成中文來看看呀。 07/31 02:33

推 tonyselina:前面兩段是計概必念的聖經白算盤第四版嗎? XDDDDDDDD 07/31 02:33

不知道。我只知道計結課本考試範圍考前我一個字一個字念過了。念完，就忘了。

推 sunsonsam:GPU搬MEM的部份似乎把記憶體加大就可以解決? 07/31 02:33

加大不是很有用，基本上問題是出在，有些事 gpu 不能做(或說 cpu 做才快)，有些是 cpu 不能做(或說 gpu 做才快)，為了要快，就要一直交接事情(搬資料)。問題不在於資料放不下(如果是放不下加大就好了)，問題是在於搬來搬去。就像是你要跑公文，公文量可能不是很多，如果公文量太多，大不了用大一點的袋子。但是你要把公文在各單位之間跑來跑去，就算公文只有一份，還是很花時間。

推 Atzivan:寬度一樣，長度改變的管子，流速會變快嗎？ 07/31 02:34

推 ertyhnm:專業文推 07/31 02:34

推 VictorTom:推專業:) 07/31 02:34

推 ruemann:要搬移就要時間，不管是用dma還是什麼鬼方法都不會比share 07/31 02:34

→ ruemann:快吧 07/31 02:34

→ tonyselina:這邊要幫糖糖說話，他是模擬半調子吧? XDD 07/31 02:34

推 SILee:to sunsonsam:因為要拉時脈就必須要縮短stage 07/31 02:34

推 kingofsdtw:看八卦長知識 07/31 02:35

推 herman602:5專業 07/31 02:35

→ sunsonsam:不會但是水全部都在管子裡面就不用到外面去拿 = 變快 07/31 02:35

推 ikari512:糟糕好像真的是反串我酸錯人了XDrz 07/31 02:35

→ SILee:問題是要做的事情還是一樣多，所以pipeline會變深 07/31 02:35

→ ikari512:5F有個分號整句文意都變了囧！！ 07/31 02:36

推 ogcxd:I服了YOU 07/31 02:36

※ 編輯: sitos 來自: 60.248.178.71 (07/31 02:39)

推 ruemann:pipeline太深，如果碰到要清空pipeline時，代價也變高 07/31 02:36

→ sunsonsam:SILee 意思是stage過大而時脈過高容易出錯是這樣嗎= = 07/31 02:36

推 choupi:y老師lab的強者出馬當然要開本尊上來推一下!! 07/31 02:37

→ SILee:sunsonsam你是EE或CS相關科系出身的嗎？ 07/31 02:38

推 tonyselina:剛剛翻了一下，是白算盤第六章內容、、、 07/31 02:38

推 ikari512:sunsonsam:時脈高不代表容易出錯而是出錯的話會很痛 07/31 02:39

推 tnav:是麥子大 ... 07/31 02:39

推 gg123sf:這種東西好像只有電機電子資工在學的樣子.. 07/31 02:39

→ SILee:如果不是的話很難跟你解釋這個觀念 0rz 小弟不擅長教學 07/31 02:39

→ ikari512:sunsonsam應該不是所以可以練習用白話文解釋看看XDD 07/31 02:39

→ ikari512:我要修正一下是stage太多會很痛跟時脈不直接相關orz 07/31 02:40

※ 編輯: sitos 來自: 60.248.178.71 (07/31 02:40)

推 ukimiu:推!!看得非常舒服，精闢好文!!值得M XD 07/31 02:40

→ sunsonsam:我是EE 我知道clock太高會有東西跟不上就出錯 07/31 02:41

→ SILee:而且這要畫圖會比較好解釋，BBS很難畫圖 07/31 02:41

→ sunsonsam:可是我不知道跟pipeline有什麼關聯= ="我知道我沒學好XD 07/31 02:41

→ SILee:是EE出身的話你該去重K白算盤啦 = =" 07/31 02:42

推 Assyla:計組魂 07/31 02:42

→ sunsonsam:XDDDDD 小的知錯 07/31 02:42

推 jeta890119:專業推 07/31 02:44

推 costbook:如果能把OS的設計一起分析就更好了 <---嘴砲 07/31 02:44

推 choupi:現在cuda的computing model和cell還蠻像的.. 07/31 02:44

兩個都很難寫... 而且要最佳化也都有很多要注意的地方。我個人覺得 CUDA 成功的機會比較大，有顯卡的人應該會比願意把 ps3 裝 linux 的人多。以 tool chain 來看 CUDA 還跟不上 cell ，不過用的人多，活下去的話，應該會漸漸越來越齊全就是了。這種 heterogeneous 的計算平台都很難寫。希望 OpenCL 會解決這個問題。 :) (不過還好其實我不用寫)

推 windward:白算盤看得很熟哦XD 07/31 02:44

推 LoLoLuan:寫的讓小學五年級看不懂就是廢文了... Change有沒有看過 07/31 02:45

對不起... 才疏學淺，還沒辦法做到深入淺出的程度。 :) ※ kof2200:轉錄至看板 PC_Shopping 07/31 02:45

→ SILee:簡單講就是要拉時脈的話單一stage內部的delay要縮短 07/31 02:45

推 johnlinvc:pipeline方面現在branch prediction的進步也是關鍵之一 07/31 02:45

→ LoLoLuan:要把眼光拉到五年及小學生一樣高啊.. 07/31 02:45

推 ruemann:這個能寫到讓小學五年級看得懂的話，那個長度會想讓人end 07/31 02:45

推 DieWalkure:AMD的K6-200不錯用阿,我還在用說,K5之前是很爛沒錯 07/31 02:46

→ SILee:所以一個stage所能做的事情就會變少 07/31 02:46

推 jazzboy:電機學過也不見得記得後來沒走系統組都忘光了 07/31 02:46

※ 編輯: sitos 來自: 60.248.178.71 (07/31 02:49)

→ DieWalkure:K7之後有度還超越Intel一下不是 !? 07/31 02:46

→ SILee:但是對同一個instruction必須要完成動作還是那麼多 07/31 02:46

推 gg123sf:這個要寫到讓小學五年級懂得話大概花40個小時講課.. 07/31 02:47

推 costbook:要讓大家看得懂，就要從8051開始講起了 <---再次嘴砲 07/31 02:47

推 LoLoLuan:有沒有一言以蔽之的解釋 XD 07/31 02:47

→ SILee:所以就必須增加stage數 07/31 02:47

推 suzukihiro:不錯像P4工程師有一些書都有寫到這些東西 07/31 02:48

推 tonyselina:說實在這個轉電蝦幹嘛? PTT其他板比較適合、、、 07/31 02:48

推 stejiang:上過Y老師的課幫推一下科科 07/31 02:48

→ LoLoLuan:例如 intel好大喜功，壞壞 AMD偷吃步自以為，笨蛋 07/31 02:48

推 eterbless:把課本講pipeline的部分轉上來就行..就只怕不夠寬 07/31 02:49

推 previa:這篇作者對目前發展很了解喔推一個! 07/31 02:49

推 kony25:you 好厲害 07/31 02:49

推 jesil:看不懂 07/31 02:50

推 costbook:可惜這篇在半夜，不然應該早就爆了 07/31 02:50

→ LoLoLuan:看吧還是很多人看不懂喔.... :Q 07/31 02:50

推 threedices:專業的八卦版..要是所有文章1/5有這種等級就好了 XD 07/31 02:50

推 jazzboy:例如 intel好大喜功，壞壞 AMD偷吃步自以為，笨蛋 XD 07/31 02:51

推 kingofsdtw:Y老師是?! 矮矮丟香蕉那個@@? 那個滿nice的 07/31 02:51

推 ptyan:我竟然看得懂部份耶QQ 07/31 02:51

推 stejiang:文章只有有"馬"字就夠資格出現在八掛板啦鄉民很愛 07/31 02:51

推 sunsonsam:問個問題如果STAGE過大而時脈又過高會怎樣? 07/31 02:51

在訊號到達之前讀資料，資料會是不穩定的，介於 0,1 之間的值會出錯。你去超頻你的電腦，把時脈調到最高，發生的情況，大概就是你上面說的那樣。 XD ※ 編輯: sitos 來自: 60.248.178.71 (07/31 02:53)

推 gg123sf:那應該會導致錯誤資訊被傳遞之後你電腦就等著升天了.. 07/31 02:52

推 eterbless:浪費時間 07/31 02:52

推 costbook:N年前的電腦雜誌也會寫這類有深度的文章，現在......... 07/31 02:52

推 feizizi:請問一下die是什麼??? 07/31 02:52

推 kof2200:PTT的真正的好文都麻在深夜過後出來~~ 07/31 02:53

→ SILee:時脈過高你的flip-flop就會存的錯誤的資料啊 07/31 02:53

→ kingofsdtw:笨笨的問一下..不能直接跳過cpu..直接丟給gpu算嗎? 07/31 02:53

目前似乎還沒有聽到這方面的解法。也許是一個可以嘗試的方向，只是對現在整體電腦產業而言，這樣的改變可能會相當痛苦，一次要改的東西實在太多了。

→ jazzboy:因為白天都被政治新聞佔滿版面了... 07/31 02:54

→ SILee:die就是從晶圓上面切下來的小電路 07/31 02:54

推 eterbless:兩個的結構不一樣... 07/31 02:54

→ james0850:好在我有讀計組還算看的懂 07/31 02:54

推 choupi:時脈太高應該會到達電子速度的極限和過熱 @@ 07/31 02:54

→ kof2200:die你拿一個CPU出來看他中心有個用鋁殼包裝的!! 07/31 02:54

→ kingofsdtw:我... 翹很多課= =||| 07/31 02:54

推 ruemann:die = 晶粒，就是晶圓做好後切下來的裸晶粒，封裝後就是IC 07/31 02:54

推 sunsonsam:所以就是會出錯嗎= = STAGE縮短是減少錯誤機率還是? 07/31 02:54

→ feizizi: 晶圓切下來的小電路?? 有沒有更精確的說法??有中文翻譯嗎 07/31 02:54

→ SILee:你平常看到的CPU和各種IC就是die外面再加上塑膠封裝的保護 07/31 02:54

推 Gaogaigar:那些詞硬用中文的話可能鞭的人會變多吧? 07/31 02:55

推 gg123sf:stage縮短是為了增加clock rate 07/31 02:55

→ kof2200:政治狂魔因為早上要上班所以會提早入睡了!! 07/31 02:55

→ feizizi:OK~~ 了解了謝謝 07/31 02:55

※ 編輯: sitos 來自: 60.248.178.71 (07/31 02:56)

推 zoo3021515:是晶粒不是粒晶喔!! 07/31 02:55

→ choupi:gpu目前還沒辦法直接存取主記憶體所以還要cpu去幫忙搬 07/31 02:55

→ SILee:我還真的不知道這些東西要怎麼翻成中文耶XD 07/31 02:56

→ kof2200:午夜過後是真正的好文包含１８禁XD 07/31 02:56

推 johnlinvc:正確來說是cmos來不及充放電因為有電容 07/31 02:56

推 lwei781: Ring oscillator delay 該講一下.... 07/31 02:56

→ kof2200:SILee那個只能比喻或是形容!! 07/31 02:56

→ apflake:AMD並沒有強調同時脈比較快,市場已經接受時脈就是效能錯誤 07/31 02:57

推 sunsonsam:你們說的clock rate是繞完一圈的還是oscillator的? 07/31 02:57

推 ruemann:AMD那時搞出一個等效計算式，amd的時脈低但等同於intel的 07/31 02:57

推 kingofsdtw:謝~ch大@@~可以搬完不回報cpu嗎?!加入新運算記號.. 07/31 02:58

推 gg123sf:AMD有強調的好像是如果型號是1300+ 代表他的效能比intel的 07/31 02:58

→ ruemann:高時脈cpu 07/31 02:58

→ gg123sf:1300還要好 07/31 02:58

推 eterbless:clock rate都是做完一個stage的 07/31 02:58

→ kingofsdtw:但是好像以線代..來解說..我好像脫褲子放屁~"~ 07/31 02:59

→ sunsonsam:原來是這樣= = 我以為是一開始給的... 07/31 02:59

→ SILee:clock rate當然是指oscillator振出來的frequency 07/31 02:59

→ sunsonsam:= = 你們兩個去打一架啦XD 07/31 02:59

推 GTOKevin:這邊釣出不少專業人士出來 07/31 02:59

→ apflake:概念,所以反而在行銷上必須隱藏時脈,例如athlon系列 07/31 02:59

推 lwsun:糟糕,我得找個翻譯... 07/31 02:59

→ suzukihiro:那個叫做PR值吧 07/31 03:00

→ SILee:不過灌進CPU的clock，CPU內部還會作升頻和除頻就是了 07/31 03:00

推 OpenGoodHate:有紫外線抹除的ROM拿來看看就知道什麼叫DIE 07/31 03:00

推 eterbless:找翻譯沒用這要從cpu結構開始講起.. 07/31 03:00

推 james0850:白算盤!!白算盤!!白算盤!!白算盤!!白算盤!!白算盤!! 07/31 03:01

→ OpenGoodHate:不過看完裡面的程式也DIE光光，記得拿壞的來玩 07/31 03:01

推 ruemann:要看die的話，拿AMD的某一代CPU就是封一半，半顆die在外面 07/31 03:01

推 costbook:clock為什麼不用PLL送？ <---底層達人 07/31 03:02

推 johnlinvc:有關clock就要從外頻和倍頻來說起了吧 07/31 03:02

推 PRAM:請翻譯 Blue who said, and whose. 這句話的中文 07/31 03:02

推 sunsonsam:把cpu的金屬蓋子拆開就看的到了不是嗎 07/31 03:02

→ sunsonsam:樓上不入虎穴焉得虎子大概10年前的笑話^.< 07/31 03:03

→ kingofsdtw:回RPM: 誰鳥你@@? 07/31 03:03

→ ruemann:快爆了快爆了 07/31 03:03

→ costbook:金屬蓋子底下那個是封裝好的IC 07/31 03:03

推 gg123sf:PRAM ..此英文非彼英文 07/31 03:04

推 PRAM:樓上年紀大了 ( ￣ c￣)y▂ξ 07/31 03:04

→ SILee:現在clock不是都用PLL振出來的嗎？ 07/31 03:04

→ costbook:die算是製程的術語，說明如上↑ 07/31 03:04

→ sunsonsam:我沒開過..之前看圖是DIE阿@@ 閃亮亮的耶 07/31 03:04

推 choupi:pram=Parallel Random Access Machine 很高深的complexity 07/31 03:05

推 dennis7653:看完這篇的心得就是...以後電腦有問題我都要寄站內信給 07/31 03:05

→ dennis7653:原PO 07/31 03:05

推 zoo3021515:給他爆給她抱 07/31 03:05

→ SILee:閃亮亮那個是die上的散熱片吧 07/31 03:06

推 suzukihiro:報 07/31 03:06

推 ruemann:我爆啦 07/31 03:06

→ sunsonsam:被搶了... 07/31 03:06

→ SILee:真正的die很脆弱的 07/31 03:06

推 kof2200:平行隨機存取機器是嗎!? 07/31 03:06

推 feizizi:GKB是什麼機構啊??XDD 07/31 03:06

→ suzukihiro:顆顆搶走了 07/31 03:06

→ zoo3021515:恭喜鈴木大得標 07/31 03:07

→ feizizi: 應該是神人呆的地方吧??? 07/31 03:07

→ kof2200:我只知道KGB 07/31 03:07

推 PRAM:是平行隨機沒錯 XD 板上高人雲集 07/31 03:07

→ poppyvodka:完全看不懂謎之領域 \冏/ 07/31 03:07

推 kingofsdtw:XD~ 原來 Pram ~"~ ...我完全外行 07/31 03:07

推 costbook:我這裡還有幾顆EPROM和紫外線抹除機，可以看到die喔 07/31 03:07

→ ruemann:我只知道 GBK 07/31 03:07

推 vic81324:有料推 07/31 03:07

推 Cheer313:真專業給你推 07/31 03:07

推 OpenGoodHate:裸裝晶粒應該只有紫外線ROM看的到，剩下都是封裝好的 07/31 03:08

→ vic81324:不過變成專業版了顆顆 07/31 03:08

→ SILee:有啦現在很多生物晶片也都是裸晶直接拿來用 07/31 03:08

推 sunsonsam:http://0rz.tw/jEB3H這個嗎? 07/31 03:08

→ costbook:不過我把抹除機拿來幫襪子殺菌...(有用嗎？) 07/31 03:09

→ SILee:不過這東西市面上應該拿不到 07/31 03:09

推 nfsnfs:Good, 超棒~ 07/31 03:09

推 kof2200:sunsonsam 是的~~ 中間那粒!! 07/31 03:10

推 OpenGoodHate:裸晶不封裝要怎麼接腳位出來@@" 07/31 03:10

→ kingofsdtw:原來這就是生物晶片@@ 疑? 07/31 03:10

推 luckystrike5: 蓋 07/31 03:11

→ sunsonsam:對阿那不就是CPU開蓋子的東西嗎QQ 07/31 03:11

→ kof2200:中間那粒外層還有包裝!! 07/31 03:11

→ SILee:那鬼東西是拋棄式的啊，用過一次就丟了 07/31 03:11

→ OpenGoodHate:連結算封裝過的不是嗎 07/31 03:12

→ kingofsdtw:把 KY弄掉後.. 用指甲刮就可以看到裸晶@@? 07/31 03:12

→ SILee:而且那只是用來檢測蛋白質的晶片，灌個操作電壓進去而以 07/31 03:12

推 zoo3021515:這個嗎? http://www.inetdaemon.com/img/eprom-lg.jpg 07/31 03:13

→ OpenGoodHate:http://zh.wikipedia.org/wiki/EPROM 07/31 03:13

推 upbed:專業推計算機組織跟計算機結構學得很好唷XDDD 07/31 03:13

→ SILee:還拿去封測廠封裝太耗成本了，所以通常都是裸晶直接上 07/31 03:13

→ kingofsdtw:我好奇的是蛋白呈色如何用晶體取代@@? 商業機密? 07/31 03:14

→ OpenGoodHate:了解，我想到好像RFID的TAG沒上封膜前好像也是裸晶 07/31 03:14

推 kof2200:交大的校長說在座的各位可以上"高等計算機結構學"了XD 07/31 03:15

推 aegis144:英文翻中文那會真的看不懂WW 07/31 03:15

→ SILee:細節我也不太懂，我不是做這個的 07/31 03:15

→ kingofsdtw:了解>\\\< 07/31 03:15

→ kof2200:呼叫原po再來禪釋一下!!有問題了~~~ 07/31 03:16

推 choupi:原po可是CA助教級以上的人物呢... 07/31 03:16

推 finkel:CELL和CUDA的程式差很多吧 CUDA的程式不難寫..麻煩的地方其 07/31 03:16

→ SILee:只知道它主要是利用電場讓蛋白質依它的極性去排列和跑動 07/31 03:16

→ finkel:實是tool還不夠成熟..很難debug 07/31 03:17

→ kingofsdtw:不過..要怎樣讓晶片組直接判斷丟給cpu和gpu.(遐想中) 07/31 03:17

→ choupi:kingofsdtw biochip上面是一些binding就會變色的物質 07/31 03:17

→ choupi:finkel 我指的是programming/computing model 07/31 03:18

→ finkel:還有原PO提到的資料傳送時間的問題，其實換一個角度來想 07/31 03:18

→ kingofsdtw:所以生物晶片的辨識儀器也只是..高級的..辨色?!.. 07/31 03:18

→ finkel:運算和資料量都不高的程式似乎也較沒有使用GPU加速的必要 07/31 03:19

應該說是總運算量高，但資料搬移的需求也多。資料搬移未必是總資料量大，而是 cpu/gpu 協同工作的時候，分工上有相依性，導致資料必須要搬來搬去的情況。至少目前我會認為這種程式不適合用 cuda 架構來加速。但有沒有加速的必要，我認為有。至於 cuda 難不難寫... 我是覺得要寫得好還滿麻煩的，必須要對 gpu 底層的運作有些了解才行。不了解當然還是可以照著寫，程式也不會出錯，只是快不起來。這樣用 cuda 的價值就降低了。

→ kingofsdtw:3D遊戲資放:胃口是養大的.. 07/31 03:20

→ finkel:programming我是覺得差滿多的呀就我自己寫過的經驗 07/31 03:20

推 LssFOREVER:看八卦長知識~~我絕到看到後面就像在看火星文 07/31 03:20

→ kingofsdtw:抱歉..我也是局外人@@~ ..都問笨問題.. 07/31 03:21

→ kof2200:記得午夜過後好文才會有!! 07/31 03:21

推 costbook:這篇比我們計算機結構期末考還難 (羞愧) 07/31 03:24

推 keepoo:翻成中文我也會看不懂幸好是用原文 07/31 03:25

推 kof2200:costbook你可以慶幸教授不會深夜爬起來看ptt的喔!! 07/31 03:25

→ costbook:教授目前出國，所以他應該起床了 XD 07/31 03:25

推 tonyselina:後面是到產業了，會考也是前面的部分吧 07/31 03:26

推 s4511981:這種文會爆可見台灣真的很多人幹這行…… 07/31 03:29

推 kof2200:考教授什麼是ddr不知道會不會猜對!? 07/31 03:30

推 maxssn:是麥子大耶..有讀過計概或微算機應該看的懂.......名詞 XD 07/31 03:31

推 feizizi:東尼又跑來裝熟了 XD 07/31 03:32

推 costbook:怪了，我們用的書是Mano那本藍皮的，怎你們都用白算盤？ 07/31 03:32

→ feizizi:請問麥子大大都在哪個版出沒啊?? 想多拜讀一下他的文章~~ 07/31 03:33

推 kof2200:costbook你哪間!? 07/31 03:34

→ feizizi:或是說請教一下版友哪個版會有類似這篇文章內容的文章?? 07/31 03:34

推 decadentCat:拍謝挖跨攏謀.......... 07/31 03:34

推 stejiang:他常出現在魔獸版阿被他電過哭哭 07/31 03:34

推 tonyselina:奇怪，會喊我裝熟，但是我又不認識你，承認是愛豬肉了 07/31 03:35

推 maxssn:魔獸板 XD 07/31 03:35

→ kof2200:魔獸版的英文是!? 07/31 03:35

→ tonyselina:還真是神奇，整天用跳板，但是推文老愛露餡，可憐 XD 07/31 03:35

→ kof2200:哪間大學的計組是用Mano那本藍皮的啊!? 07/31 03:36

推 choupi:WarCraft 07/31 03:37

推 costbook:喔...我們是"科大"。藍皮書太簡單了嗎？ 07/31 03:37

→ kof2200:掯~~~好難!!可以給校名嗎!?我馬上發email申訴!! 07/31 03:38

推 tonyselina:kof是在幹嘛? 話說轉這文去電蝦就超奇怪的 07/31 03:39

→ kof2200:增加知識!!獨樂樂不如眾樂樂~~ 07/31 03:40

→ kof2200:我每天晚上都熬夜蒐集一些很好的文章!! 07/31 03:42

推 kingofsdtw:爆!! 我只知道三國版.. WarCraft! 07/31 03:42

推 suzukihiro:轉就轉了有差嗎 07/31 03:45

推 kof2200:tonyselina你怎麼知道我用跳板!?你是我認識的嗎!? 07/31 03:50

推 e04su3:不是很懂但看起來很專業大家都推我就推吧 07/31 03:54

推 kof2200:小弟錯了!!我刪除了~~~ 07/31 03:55

推 OpenGoodHate:<-stallings 培生只上一學期一整個沒印像的計組 07/31 03:57

推 vintw:除了OpenCL之外據傳微軟也在下一版的DirectX訂定類似的規範 07/31 03:58

→ OpenGoodHate:intel 推 Larrabee 想要在分散式領域幹掉NV 07/31 04:01

分散式指的是平行計算嗎? 如果能夠的話，希望能在別的板看到一些更細節的東西。大家提出來的點都滿有趣的。 :)

推 vintw:在研討會上遇過的很多研究者對Larrabee抱有高度的期待 07/31 04:01

→ vintw:倒是ATi到目前為止都沒有實際動作，不知道下一步會是什麼 07/31 04:02

上次聽 amd/ati 的人演講，似乎也是要往 opencl 靠過去。但我還沒看到什麼具體作為。

推 germ611:快推...不然會被說我看不懂 07/31 04:03

推 OpenGoodHate:MS的好像是叫HLSL吧用DX11的SHADER改的(上課印像) 07/31 04:06

→ OpenGoodHate:看了一下筆記，講反了，是HLSL→COMPUTER SHADER 07/31 04:08

推 james732:有看有推!! 07/31 04:11

推 Lindemann:推專業認真文 07/31 04:19

推 seiyaku:這才叫專業! 07/31 04:19

推 Waterpig:不推人家會說我們看不懂~~ 07/31 04:24

推 vkyoung:這篇只要稍具"電"字背景都可以看得懂, 很深入淺出的好文! 07/31 04:25

推 lolikung:推這篇，計組魂XDDDD 07/31 04:31

推 bomberhack:這篇的重點就是現在的硬體設計偏向硬體整合系統的 07/31 04:43

→ bomberhack:分工合作設計方式,藉以提高軟體的效能. 07/31 04:44

推 blackkane:我怎麼覺得重點是澇英文= = 單元管線南北橋主記憶體 07/31 04:49

→ blackkane:週期時脈..不懂為啥一定要打英文弄的文章看來就很難讀 07/31 04:51

推 Phater:有看有推 07/31 04:51

推 jeta890119:有些東西講英文比中文好懂 07/31 04:56

→ jeta890119:就像數位邏輯的：OR AND NOR NAND XOR 翻中文好懂嗎？ 07/31 04:57

推 upbed: 或及反或反及互斥反或 07/31 05:08

推 blackkane:我知道阿單元週期記憶體英文會比較好懂嗎= =? 07/31 05:09

推 upbed: I know a Unit cycle memory 07/31 05:10

→ blackkane:instruction之間真的都是independent < 打獨立會難懂囧? 07/31 05:11

推 albert7387:推完全看不懂 07/31 05:11

→ upbed: 指令獨立 07/31 05:11

推 suzukihiro:有時候中文字你會混淆意思尤其像管線深度之類的 07/31 05:12

→ upbed:說真的喔~那個管線跟pipeline我覺得沒什麼關聯= = 07/31 05:13

推 blackkane:我是說非必要性的啦= = 獨立和相依那個我看到覺得超蝦.. 07/31 05:13

→ upbed:講「生產線」還比較容易懂…當然樓上提的獨立打獨立會比較好 07/31 05:13

推 suzukihiro:可能跟個人習慣有關吧...或許被老闆要求成這樣 07/31 05:14

→ blackkane:管線這名詞翻譯不是解釋意思反而像是形容一種觀念想法 07/31 05:14

→ suzukihiro:自然而然寫出來就變這樣了 07/31 05:14

→ blackkane:share 就打分享阿= = 弄得半洋半中的閱讀很痛苦 07/31 05:16

→ blackkane:鄉民很愛推的 i有thing要跟you say 就很像這種文章.. 07/31 05:17

推 suzukihiro:其實還好...很多老師上課都這樣搞 07/31 05:17

→ suzukihiro:早就被苦毒慣了... 07/31 05:18

→ blackkane:我知道很多老師都愛這樣可是不代表自己要這樣阿... 07/31 05:18

→ suzukihiro:大概是被影響到了吧 XDD 07/31 05:18

→ blackkane:上課教學表達是一種筆記方式能快速表達當然是好 07/31 05:19

→ blackkane:但當打一篇文章時就應該要要求用字遣詞了阿..= = 07/31 05:19

→ suzukihiro:或許有人喜歡用口語化來打字這是個人習慣 07/31 05:20

→ blackkane:我生活笑的音是呵呵阿我不就可以打注音ㄏㄏ更傳神? 07/31 05:21

→ erasermyself:我跑來電蝦版了嗎 07/31 05:21

→ suzukihiro:我也不能說他不對這是他的習慣我沒什麼資格要求她改 07/31 05:21

→ suzukihiro:我又不是他老爸老媽老師之類的 07/31 05:21

→ blackkane:也許吧= = 但不管中英內容是很正確的 pipeline解釋不錯 07/31 05:22

→ suzukihiro:可以阿你打ㄏㄏ我也沒意見顆顆 07/31 05:22

→ blackkane:沒要他改阿也沒說他錯阿推文不就舒發自己心得用的.. 07/31 05:23

推 suzukihiro:那就對啦顆顆 07/31 05:24

推 suPerFlyK:（′・ω・‵） 07/31 05:37

推 jeromeshih:推原po分享文 07/31 05:39

推 sandowZ:我竟然看得懂.... = =" 07/31 06:39

推 neofire:這篇好像也沒什麼吧....四年多前的pcdiy有相同的東西 07/31 06:48

→ neofire:不過人家雜誌的內容頗有水準,不會連製程,單位,都不會打 07/31 06:49

→ neofire:而且這種東西,隨便問一個從celeron 300 oc 500的玩家都弄 07/31 06:51

→ neofire:的出類似的心得,那些問題當初p4上市都有雜誌刊出這種論點 07/31 06:54

→ neofire:當時是2002年 07/31 06:55

推 jefflaii:這篇超專業的 07/31 07:05

推 PHINEAR:第三段總歸一句話，就是hazard的代價 07/31 07:25

推 PHINEAR:指令平行的部份還有superscalar這技術 07/31 07:29

推 roea68roea68:.........太專業了 07/31 07:31

推 ymsgcat:......我看懂了 07/31 07:45

→ gname:慘了... 我剛好都看的懂...我是不是很宅啊...>< 07/31 08:10

推 Darkword1987:超專業 07/31 08:30

推 woohyuk49:推麥大...超威 07/31 08:35

推 bearching:八卦的清流XD 07/31 08:37

推 parkerlived:Intel如果把nvidia吃下來的話....amd真的要哭哭了 07/31 08:37

推 zznkqb:寫得非常的清楚，八卦板果然是神出鬼沒的地方 :) 07/31 08:38

推 sohate5566:換句話說,Intel當時覺得netburst衝時脈已經不行了 07/31 08:39

→ sohate5566:所以又改回P3一樣的微架構繼續推新的產品 07/31 08:39

→ sohate5566:到了i7以後就換了另一種叫做QPI的架構了 07/31 08:40

我不太清楚 netburst 是什麼，但 QPI 應該不屬於微架構的一部份(吧?) QPI 全名是 QuickPath Interconnect ，也就是互連的介面，主要是用來連接處理器，輸出入單元跟記憶體。並沒有牽涉到處理器內部的設計，所以和微架構不是那麼相關。這個 demo 影片滿不錯的: http://www.intel.com/technology/quickpath/demo/demo.htm

推 McHamburger:end 07/31 08:41

推 suzukihiro:SOHATE講的算是精華 XXDD 07/31 08:48

推 cpt:其實CPU市場萎縮是遲早的事情 AMD不另尋活路只會越來越慘 07/31 08:52

→ cpt:Intel早已布局和TSMC合作打ARM 自己的製程也往將來做SoC發展 07/31 08:53

推 wholewing:怎麼辦，我都看不懂QQ 07/31 08:54

→ cpt:再往更久的未來看如果cloud computing開始主流化整個軟硬體 07/31 08:56

→ cpt:市場生態搞不好都會重新洗牌 07/31 08:56

推 morris2:兄台在晶心上班嗎? 07/31 09:09

推 Maybetrue:專業 07/31 09:22

推 sohate5566:簡單說Intel過一段時間就腳位技術全都換一換繼續噱錢 07/31 09:29

→ sohate5566:Intel就靠洗腦跟技術大搬風就可以噱到一堆無知人的錢了 07/31 09:30

推 im5566:資工魂XD 07/31 09:30

→ sohate5566:所以說請板友們繼續買AMD不是沒有理由的,別讓AMD倒下去 07/31 09:30

→ sohate5566:...完了我會不會被Intel告啊囧 07/31 09:34

推 nfsong:感恩 07/31 09:34

推 Mizake:麥大推推 07/31 09:42

推 jimihsu:太專業了, 沒八卦.......那 VIA 呢 ? XDDDDD 07/31 09:43

推 willwuwillwu:高手好厲害 07/31 09:43

※ 編輯: sitos 來自: 140.112.31.132 (07/31 09:54)

推 gmlush:像這種東西翻成中文才會更多人看不懂...專業推 07/31 09:47

推 abucat:M系列是十年左右才有一次的改革....... 07/31 09:49

推 LucasChen:拜讀 07/31 09:51

→ syh7211:專業!!所以完全看不懂= = 07/31 09:51

推 asuka627:跨嚨某......太專業的關係？ 07/31 09:54

推 TurtleBB:推一下，超專業。 07/31 09:57

推 ntcbacc:太專業了,我還請同事幫我翻譯 07/31 10:03

推 koibito1103:想問她要不要跟樓下的經濟學結拜攻佔台灣理論市場... 07/31 10:05

推 BIGHEADXYZ:因為單就時脈來講,目前CPU的效能還是遠勝於GPU的 07/31 10:14

推 YouCantGetME:喔呵是麥子 07/31 10:14

推 dragoni:推一下 07/31 10:15

→ BIGHEADXYZ:而且也不是什麼程式都能作平行,或許以後在設計演算法上 07/31 10:15

→ BIGHEADXYZ:都會朝著以平行的角度去思考吧:D 07/31 10:16

這種聲音現在很多。對於解同一個問題而最佳化的程式來說，非平行程式的演算法在單一執行緒可能可以執行得很快，但可能無法平行化。而平行程式的演算法在單一執行緒時可能較慢，但透過多個執行緒同時執行，還是可以達到加速的效果。能夠直接被平行化的程式，現在工具很齊全，要平行化相對起來比較容易。但有很多演算法一開始設計的時候沒有考慮到平行化的問題，就變得很難處理。因此對於解同一個問題而言，為了平行化而演算法整個重新設計的例子也不少。這是可能是繼續榨出效能的唯一方法了。因為單一處理器的效能可能快要走到盡頭了。

推 BIGHEADXYZ:單台電腦有OpenMP和CUDA叢集電腦有MPI,或許未來真的是 07/31 10:21

→ BIGHEADXYZ:平行程式的天下了吧? 07/31 10:21

現在幾乎所有的人都在推廣這件事，畢竟程式能平行化，多核心系統才有用，多核心系統有用，大家才會買，整個電腦產業才會繼續走下去。但事情也許不會那麼樂觀，如果景氣不好，低價低功率系統也會變成主流。電費現在也是很貴的，一直衝效能未必符合市場的需求。 ※ 編輯: sitos 來自: 140.112.31.132 (07/31 10:33)

推 lovetyrano:推 07/31 10:30

→ kondoyu:系統程式被當掉哭哭 07/31 10:30

推 derayxu:同學注意! 這篇下學期的期中考會考, 請畫重點! 07/31 10:37

推 japan428:我小五的時候就看的懂了..... 07/31 10:46

推 stone0504: 07/31 10:50

推 kof2200:考台清交成研究所考生注意!!這篇明年研究考試會考XD 07/31 10:53

→ kof2200:台大去年資工的OS考的好機車!!可以申訴一下嗎XD 07/31 10:54

推 Deltaguita:那以後還會有專業繪圖卡跟一般顯卡的區別嗎? 07/31 11:03

其實我到現在還不是很懂專業繪圖卡跟一般顯卡的差別，我不是做影像處理的。以之前粗略的了解，至少在 gpgpu 的架構底下，主要也只差在運算單元的多寡而已。當然，多寡就決定速度，但兩者之間似乎沒有太明顯本質上的差別。不過這應該要請對這方面了解更深的人來回答比較恰當。

→ Deltaguita:改個函式庫就能就差很多~ 以後還是會這樣? 07/31 11:04

推 Pumama:管線跟記憶體是必考題這篇要讀熟 07/31 11:12

推 livilivilivi:怎麼辦我全部看的懂說~ 07/31 11:17

推 pkgo50:計組計結魂!! 07/31 11:20

推 mgdesigner:這是篇難得的專業文阿！順便回某些鄉民，計算機結構學 07/31 11:27

→ mgdesigner:本來就很深阿.... 07/31 11:28

推 qbaow:快推不然別人會說我看不懂!! 07/31 11:30

推 OpenGoodHate:專業繪圖卡差在穩定度差很多 By：我的圖學老師 07/31 11:31

推 gcshin:看不懂…推一下裝懂好了 07/31 11:33

推 livilivilivi:禿然想到intel以前推過的VLIW,好像被搞的沒消沒息~ 07/31 11:34

VLIW (very long instruction word) 之前似乎是 intel + hp 在努力推廣。代表作是 itanium 2 。在商用機器上面應該還是有不錯的表現，但我沒有用過實機，身邊也沒人用過，不知道實際上的效能怎麼樣。當然 intel 自己會說很好，不過用得人似乎沒有很多，那代表??

推 eddiewen:專業推！ 07/31 11:39

推 abc0:那OpenCL跟Cuda會相容嗎? 07/31 11:39

OpenCL 還沒有制定完成，但以 wikipedia 上的資料， nvidia 也是發起者之一，如果 nvidia 願意的話，應該是有機會可以相容或某種程度的互通。不過偏軟體這方面我就不太熟悉了。

推 OortCloud:其實現在電腦會慢都是卡在匯流排的頻寬不足.... 07/31 11:47

→ OortCloud:還有某個機械性結構的東西.... 07/31 11:48

解決匯流排問題可以另外再寫一篇了。其實也是一直都有進步，只是產品化的還不多。

推 coolfishman:看不懂 07/31 11:51

推 imprezasti:計組計結魂!! 07/31 12:02

推 lindet:XD 同學推不愧是正教授! 07/31 12:03

→ applejone:其實有不少錯誤 07/31 12:11

哈，相信一定會有的。

推 Pash77:不能說錯很大! 只能說謬誤蠻多的... 07/31 12:12

→ Pash77:面積影響的是良率，不是成本，而且不是平方關係... 07/31 12:13

→ Pash77:全部看懂但不知道錯在哪的，CO/CA兩本都要重看了 07/31 12:14

良率會影響成本。當然說和面積呈平方是過於簡化，主要是想表達超線性的成長。不同的製造過程，不同技術，影響的狀況也不一樣。這請半導體製程專業的人來講好了。至少對做 CA 的人來講，目標就是讓面積變低，至於會變便宜多少，倒是不太會仔細去估。通常會看到面積可以省幾 % ，但不太會去估錢會差多少。

推 garytsai:正教授+1 07/31 12:15

推 lindet:...面積影響良率良率影響成本好像沒錯啊 07/31 12:15

→ Pash77:面積跟良率的公式不是那麼簡單的關係，成本的計算當然錯了! 07/31 12:17

推 IntelC2D:推啊...! 07/31 13:05

推 huckebein12:雖然不是看不懂，但是真的沒必要打一堆英文衝專業度 07/31 13:07

→ huckebein12:打英文又不會比打中文快速，何必呢？ 07/31 13:08

因為平常在打跟計算機結構相關的東西的時候，已經很少用中文在打了。而且腦袋裡面第一時間浮現出來的也是英文的名詞，不是中文的名詞。要轉成中文還需要花一點時間去想，才知道對應的詞是什麼。其實這裡面寫的東西也沒多專業，用英文單純只是貪個方便而已。看大家覺得這麼痛苦，下一次中英文都標出來好了。

推 showforce:計組魂啦!! 07/31 13:14

推 cityeffect:快推～不然別人以為我們看不懂～ 07/31 13:38

推 winble:推 07/31 13:55

※ 編輯: sitos 來自: 140.112.31.132 (07/31 14:00)

推 fish0612:看不懂耶囧rz 07/31 14:55

推 alskdj:反正沒錢預算不夠都用不到 $$$$$$$$$$$$$$$$$$$$$$$$$$$$ 07/31 15:37

推 irix2007:我個人會賭OpenCL, 不想試cuda..不過M$不想加入OpenCL.. 07/31 15:48

推 ss60315:老實說我看不懂.. 07/31 16:22

推 padro:clock rate一直都跟pipeline有關 07/31 16:33

→ padro:在northwood之後 prescott更是深化到40 (沒記錯的話) 07/31 16:34

→ padro:因為分支預測錯誤上升在低時脈反而會在效能上有更大下降 07/31 16:35

→ padro:prescott在超過3.8G的效能可以狂電northwood 07/31 16:36

→ padro:問題卻又無法解決clock攀升後造成的問題(本文內有提到) 07/31 16:36

→ padro:更正 prescott pipeline 31 stages 07/31 16:37

推 padro:另外在Processor部分各家都有爭論但PC上用的GPP使用指令集 07/31 16:43

→ padro:目前是被過去給綁死了包含設計概念 07/31 16:43

→ padro:Cell使用的PPE+SPE概念其實是一個相對前衛的processor 07/31 16:44

→ padro:幾乎是朝向把GPP+GPGPU的概念整合 07/31 16:45

→ mamaka:中英文夾雜昏了 07/31 17:15

推 CaoPi:推啊！ 07/31 17:21

推 bigbigword:一半一上看不懂...囧 07/31 18:43

→ tinlans:我對 CUDA 沒興趣，H.264 的實作殘廢又跛腳。 07/31 18:43

→ bigbigword: 以上 07/31 18:43

→ tinlans:這種中英夾雜是好的，看過全中文專利真的是會昏倒。 07/31 18:44

推 BlueRacing:一年沒碰書我竟然還看的懂 XD 資工魂～～ 07/31 18:52

推 ddx:好文！推一個 07/31 19:23

推 wefun:縮短pipeline,增加 paralism數,目前看來這個策略是正確的 07/31 20:15

推 gmoz:GOOD 07/31 20:26

→ gmoz:資工的看不懂這篇該打屁股XD 07/31 20:28

推 cloudstr:快推不然別人說我看不懂 07/31 21:39

推 DDR2:今天買了245~ 07/31 22:24

推 spfd:太專業了~看不太懂~不過還是推 08/01 09:44

推 sohate5566: 推 DDR2:今天買了245~ 08/01 10:03

推 philipwen:借轉 08/01 11:45

-- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.228.171.251

推 eggimage:太專業了 08/01 12:34

推 Farlang:專業文推!!! 08/02 08:31