→ gg123sf:計組計結魂!! 07/31 02:20
→ gg123sf:其實clock rate衝高系統反而容易掛 現在主戰場是分工合作 07/31 02:21
我不太確定你說的容易掛指的是哪個部份。如果單純是同一種架構,
clock rate 高的確可能會因為 technology variation 造成訊號錯誤的情況。
降頻一下,等訊號穩定再讀就沒問題了。 :)
分工合作的部份我猜你是說用特殊的指令集或 function unit 來加速。
這部份也是做得.... 我個人覺得有點過火了 XD
MMX/SSE/SSE2 之後來有一個什麼來著的... 忘了。
雖然都是 x86 ,但多出來的東西,舊的機器可是一概不支援的。
→ a0801284545:太專業 看無 07/31 02:22
推 sunsonsam:原來clock rate跟pipeline有關聯..................... 07/31 02:23
推 magecandy:半吊子鄉民:你幹嘛講話不用中文好好講 要夾一堆英文? 07/31 02:23
推 zoo3021515:專業推 07/31 02:24
→ cloud7515:8核心! INTEL:我多你八核心 07/31 02:24
推 autoupdate:用中文講 五樓也是看不懂 07/31 02:24
→ sidi:好我看懂一個 時脈 這樣可以了可以了吧 07/31 02:24
推 ruemann:他用的英文還可以啦,只是北橋用英文會比較好? 07/31 02:24
抱歉,也許用北橋講就好了。 :)
推 dingyuchi:推一下 這篇應該要給M 07/31 02:24
→ feizizi:你會不會太猛了啊??? 連GPU你都能投頭是道 拜服啊 07/31 02:25
推 GTOKevin:專業推 07/31 02:25
推 captdavince:推啊~接下來就是整合cpu和gpu在同一塊上了吧 07/31 02:26
推 pdaer:越跑越快越跑越吃電 以後玩遊戲耗電量跟煮火鍋一樣了 07/31 02:26
要記得買電扇...
推 ruemann:cpu整合gpu……有應用再說吧,m$不支援api的話,就沒用了 07/31 02:27
已經有應用了阿。可以到 nvidia 的網站上面找 CUDA 。
如果你有 8400 以上的板子就有支援,可以跑跑它的 demo 程式。
(當然要裝一些 nvidia 提供的軟體)
會比用 cpu 跑快非常非常多。
而且開發介面也可以跟 vs 整合在一起, m$ 沒道理去擋這東西,
對他們一點壞處也沒有。 :)
※ 編輯: sitos 來自: 60.248.178.71 (07/31 02:31)
推 sunsonsam:不太懂時脈跟管線深度有什麼關係 時脈不是震盪器給的嗎 07/31 02:27
時脈的極限是來自於一個邏輯電路的訊號多久穩定到可以被讀出來,
而訊號穩定取決於線路的長度還有一些設計相關的參數,
我不是做 EDA 的,所以細節不是非常清楚。
用一個過度簡化(不真實)的講法來講,假設你要做的事情有五件事,
每一件事要做一秒,你五件事永遠要一起做,你就是要花五秒才能做完一件事。
而且因為五件事都一定要一起做,所以同時也只能做其中的某一件。
如果你可以把五件事拆開給五個人做,每一個人做一件事,就只需要一秒。
第一個人做完,就把事情交接給第二個人,他又可以再去做另一件事。
而這時候,我們可以把交接想像成一個檢查點,也就是一個時脈週期。
所以,事情拆得越散,做完「一件」需要的時間就越短,時脈就可以越高。
大致上的概念是這樣子,實作上當然還有很多其它需要考量的問題。
英文用少一點會比較好嗎 :)
推 OpenGoodHate:底層達人出沒請小心 07/31 02:28
→ feizizi:八卦就是要有這種水準的文章才high啊~~~ XDDDDDDD 07/31 02:28
推 reallocust:4850的GPU已經夠拿來煮火鍋了...(X的,現在房間超熱的) 07/31 02:28
推 mike1990:看完了 還是看的懂耶 呵呵 07/31 02:29
推 fin806:GPU->CPU山寨板 比CPU威 還可以煮火鍋 07/31 02:29
→ OpenGoodHate:22台i7+GTX275 開下去冷氣會滴水 07/31 02:30
→ kslman:下次整篇英文才不會被酸 07/31 02:30
推 allen7976:I 怎麼都 watch 不懂... 07/31 02:30
推 AAAA:很多東西翻成中文反而會更不順 07/31 02:30
推 eric93: 07/31 02:30
推 HornyDragon:酸的人可以把這篇的英文都翻成中文試試看...... 07/31 02:30
推 skciv:白算盤 07/31 02:31
→ OpenGoodHate:GPU有自己的核心,記憶體跟板子,但是還不能宣佈獨立 07/31 02:31
※ 編輯: sitos 來自: 60.248.178.71 (07/31 02:35)
推 ikari512:推 autoupdate:用中文講 五樓也是看不懂 07/31 02:32
推 asgard1991:只能推了 囧"> 07/31 02:32
推 leopastiom:趕快推 不然人家以為你看不懂!!!!!!!!!!!!!!!!!!!! 07/31 02:32
→ ikari512:不然5F翻成中文來看看呀。 07/31 02:33
推 tonyselina:前面兩段是計概必念的聖經白算盤第四版嗎? XDDDDDDDD 07/31 02:33
不知道。我只知道計結課本考試範圍考前我一個字一個字念過了。念完,就忘了。
推 sunsonsam:GPU搬MEM的部份 似乎把記憶體加大就可以解決? 07/31 02:33
加大不是很有用,基本上問題是出在,有些事 gpu 不能做(或說 cpu 做才快),
有些是 cpu 不能做(或說 gpu 做才快),為了要快,就要一直交接事情(搬資料)。
問題不在於資料放不下(如果是放不下加大就好了),問題是在於搬來搬去。
就像是你要跑公文,公文量可能不是很多,如果公文量太多,大不了用大一點的袋子。
但是你要把公文在各單位之間跑來跑去,就算公文只有一份,還是很花時間。
推 Atzivan:寬度一樣,長度改變的管子,流速會變快嗎? 07/31 02:34
推 ertyhnm:專業文推 07/31 02:34
推 VictorTom:推專業:) 07/31 02:34
推 ruemann:要搬移就要時間,不管是用dma還是什麼鬼方法都不會比share 07/31 02:34
→ ruemann:快吧 07/31 02:34
→ tonyselina:這邊要幫糖糖說話,他是模擬半調子吧? XDD 07/31 02:34
推 SILee:to sunsonsam:因為要拉時脈就必須要縮短stage 07/31 02:34
推 kingofsdtw:看 八卦長知識 07/31 02:35
推 herman602:5專業 07/31 02:35
→ sunsonsam:不會 但是水全部都在管子裡面就不用到外面去拿 = 變快 07/31 02:35
推 ikari512:糟糕 好像真的是反串 我酸錯人了XDrz 07/31 02:35
→ SILee:問題是要做的事情還是一樣多,所以pipeline會變深 07/31 02:35
→ ikari512:5F有個分號 整句文意都變了 囧!! 07/31 02:36
推 ogcxd:I服了YOU 07/31 02:36
※ 編輯: sitos 來自: 60.248.178.71 (07/31 02:39)
推 ruemann:pipeline太深,如果碰到要清空pipeline時,代價也變高 07/31 02:36
→ sunsonsam:SILee 意思是stage過大而時脈過高容易出錯 是這樣嗎= = 07/31 02:36
推 choupi:y老師lab的強者出馬 當然要開本尊上來推一下!! 07/31 02:37
→ SILee:sunsonsam你是EE或CS相關科系出身的嗎? 07/31 02:38
推 tonyselina:剛剛翻了一下,是白算盤第六章內容、、、 07/31 02:38
推 ikari512:sunsonsam:時脈高不代表容易出錯 而是出錯的話會很痛 07/31 02:39
推 tnav:是麥子大 ... 07/31 02:39
推 gg123sf:這種東西好像只有電機電子資工在學的樣子.. 07/31 02:39
→ SILee:如果不是的話很難跟你解釋這個觀念 0rz 小弟不擅長教學 07/31 02:39
→ ikari512:sunsonsam應該不是 所以可以練習用白話文解釋看看XDD 07/31 02:39
→ ikari512:我要修正一下 是stage太多會很痛 跟時脈不直接相關orz 07/31 02:40
※ 編輯: sitos 來自: 60.248.178.71 (07/31 02:40)
推 ukimiu:推!!看得非常舒服,精闢好文!!值得M XD 07/31 02:40
→ sunsonsam:我是EE 我知道clock太高會有東西跟不上就出錯 07/31 02:41
→ SILee:而且這要畫圖會比較好解釋,BBS很難畫圖 07/31 02:41
→ sunsonsam:可是我不知道跟pipeline有什麼關聯= ="我知道我沒學好XD 07/31 02:41
→ SILee:是EE出身的話你該去重K白算盤啦 = =" 07/31 02:42
推 Assyla:計組魂 07/31 02:42
→ sunsonsam:XDDDDD 小的知錯 07/31 02:42
推 jeta890119:專業推 07/31 02:44
推 costbook:如果能把OS的設計一起分析就更好了 <---嘴砲 07/31 02:44
推 choupi:現在cuda的computing model和cell還蠻像的.. 07/31 02:44
兩個都很難寫... 而且要最佳化也都有很多要注意的地方。
我個人覺得 CUDA 成功的機會比較大,
有顯卡的人應該會比願意把 ps3 裝 linux 的人多。
以 tool chain 來看 CUDA 還跟不上 cell ,不過用的人多,
活下去的話,應該會漸漸越來越齊全就是了。
這種 heterogeneous 的計算平台都很難寫。
希望 OpenCL 會解決這個問題。 :)
(不過還好其實我不用寫)
推 windward:白算盤看得很熟哦XD 07/31 02:44
推 LoLoLuan:寫的讓小學五年級看不懂 就是廢文了... Change有沒有看過 07/31 02:45
對不起... 才疏學淺,還沒辦法做到深入淺出的程度。 :)
※ kof2200:轉錄至看板 PC_Shopping 07/31 02:45
→ SILee:簡單講就是要拉時脈的話單一stage內部的delay要縮短 07/31 02:45
推 johnlinvc:pipeline方面 現在branch prediction的進步也是關鍵之一 07/31 02:45
→ LoLoLuan:要把眼光拉到五年及小學生一樣高啊.. 07/31 02:45
推 ruemann:這個能寫到讓小學五年級看得懂的話,那個長度會想讓人end 07/31 02:45
推 DieWalkure:AMD的K6-200不錯用阿,我還在用說,K5之前是很爛沒錯 07/31 02:46
→ SILee:所以一個stage所能做的事情就會變少 07/31 02:46
推 jazzboy:電機學過也不見得記得 後來沒走系統組都忘光了 07/31 02:46
※ 編輯: sitos 來自: 60.248.178.71 (07/31 02:49)
→ DieWalkure:K7之後有度還超越Intel一下不是 !? 07/31 02:46
→ SILee:但是對同一個instruction必須要完成動作還是那麼多 07/31 02:46
推 gg123sf:這個要寫到讓小學五年級懂得話 大概花40個小時講課.. 07/31 02:47
推 costbook:要讓大家看得懂,就要從8051開始講起了 <---再次嘴砲 07/31 02:47
推 LoLoLuan:有沒有一言以蔽之的 解釋 XD 07/31 02:47
→ SILee:所以就必須增加stage數 07/31 02:47
推 suzukihiro:不錯 像P4工程師有一些書 都有寫到這些東西 07/31 02:48
推 tonyselina:說實在這個轉電蝦幹嘛? PTT其他板比較適合、、、 07/31 02:48
推 stejiang:上過Y老師的課幫推一下 科科 07/31 02:48
→ LoLoLuan:例如 intel好大喜功,壞壞 AMD偷吃步自以為,笨蛋 07/31 02:48
推 eterbless:把課本講pipeline的部分轉上來就行..就只怕不夠寬 07/31 02:49
推 previa:這篇作者對目前發展很了解喔 推一個! 07/31 02:49
推 kony25:you 好厲害 07/31 02:49
推 jesil:看不懂 07/31 02:50
推 costbook:可惜這篇在半夜,不然應該早就爆了 07/31 02:50
→ LoLoLuan:看吧 還是很多人看不懂喔.... :Q 07/31 02:50
推 threedices:專業的八卦版..要是所有文章1/5有這種等級就好了 XD 07/31 02:50
推 jazzboy:例如 intel好大喜功,壞壞 AMD偷吃步自以為,笨蛋 XD 07/31 02:51
推 kingofsdtw:Y老師是?! 矮矮丟香蕉那個@@? 那個滿nice的 07/31 02:51
推 ptyan:我竟然看得懂部份耶QQ 07/31 02:51
推 stejiang:文章只有有"馬"字就夠資格出現在八掛板啦 鄉民很愛 07/31 02:51
推 sunsonsam:問個問題 如果STAGE過大而時脈又過高 會怎樣? 07/31 02:51
在訊號到達之前讀資料,資料會是不穩定的,介於 0,1 之間的值會出錯。
你去超頻你的電腦,把時脈調到最高,發生的情況,大概就是你上面說的那樣。 XD
※ 編輯: sitos 來自: 60.248.178.71 (07/31 02:53)
推 gg123sf:那應該會導致錯誤資訊被傳遞 之後你電腦就等著升天了.. 07/31 02:52
推 eterbless:浪費時間 07/31 02:52
推 costbook:N年前的電腦雜誌也會寫這類有深度的文章,現在......... 07/31 02:52
推 feizizi:請問一下die是什麼??? 07/31 02:52
推 kof2200:PTT的真正的好文都麻在深夜過後出來~~ 07/31 02:53
→ SILee:時脈過高你的flip-flop就會存的錯誤的資料啊 07/31 02:53
→ kingofsdtw:笨笨的問一下..不能直接跳過cpu..直接丟給gpu算嗎? 07/31 02:53
目前似乎還沒有聽到這方面的解法。也許是一個可以嘗試的方向,
只是對現在整體電腦產業而言,這樣的改變可能會相當痛苦,
一次要改的東西實在太多了。
→ jazzboy:因為白天都被政治新聞佔滿版面了... 07/31 02:54
→ SILee:die就是從晶圓上面切下來的小電路 07/31 02:54
推 eterbless:兩個的結構不一樣... 07/31 02:54
→ james0850:好在我有讀計組還算看的懂 07/31 02:54
推 choupi:時脈太高應該會到達電子速度的極限 和過熱 @@ 07/31 02:54
→ kof2200:die你拿一個CPU出來看他中心有個用鋁殼包裝的!! 07/31 02:54
→ kingofsdtw:我... 翹很多課= =||| 07/31 02:54
推 ruemann:die = 晶粒,就是晶圓做好後切下來的裸晶粒,封裝後就是IC 07/31 02:54
推 sunsonsam:所以就是會出錯嗎= = STAGE縮短是減少錯誤機率還是? 07/31 02:54
→ feizizi: 晶圓切下來的小電路?? 有沒有更精確的說法??有中文翻譯嗎 07/31 02:54
→ SILee:你平常看到的CPU和各種IC就是die外面再加上塑膠封裝的保護 07/31 02:54
推 Gaogaigar:那些詞硬用中文的話可能鞭的人會變多吧? 07/31 02:55
推 gg123sf:stage縮短是為了增加clock rate 07/31 02:55
→ kof2200:政治狂魔因為早上要上班所以會提早入睡了!! 07/31 02:55
→ feizizi:OK~~ 了解了 謝謝 07/31 02:55
※ 編輯: sitos 來自: 60.248.178.71 (07/31 02:56)
推 zoo3021515:是晶粒 不是粒晶喔!! 07/31 02:55
→ choupi:gpu目前還沒辦法直接存取主記憶體 所以還要cpu去幫忙搬 07/31 02:55
→ SILee:我還真的不知道這些東西要怎麼翻成中文耶XD 07/31 02:56
→ kof2200:午夜過後是真正的好文包含18禁XD 07/31 02:56
推 johnlinvc:正確來說是cmos來不及充放電 因為有電容 07/31 02:56
推 lwei781: Ring oscillator delay 該講一下.... 07/31 02:56
→ kof2200:SILee那個只能比喻或是形容!! 07/31 02:56
→ apflake:AMD並沒有強調同時脈比較快,市場已經接受時脈就是效能錯誤 07/31 02:57
推 sunsonsam:你們說的clock rate是繞完一圈的還是oscillator的? 07/31 02:57
推 ruemann:AMD那時搞出一個等效計算式,amd的時脈低但等同於intel的 07/31 02:57
推 kingofsdtw:謝~ch大@@~可以搬完不回報cpu嗎?!加入新運算記號.. 07/31 02:58
推 gg123sf:AMD有強調的好像是如果型號是1300+ 代表他的效能比intel的 07/31 02:58
→ ruemann:高時脈cpu 07/31 02:58
→ gg123sf:1300還要好 07/31 02:58
推 eterbless:clock rate都是做完一個stage的 07/31 02:58
→ kingofsdtw:但是 好像以線代..來解說..我好像脫褲子放屁~"~ 07/31 02:59
→ sunsonsam:原來是這樣= = 我以為是一開始給的... 07/31 02:59
→ SILee:clock rate當然是指oscillator振出來的frequency 07/31 02:59
→ sunsonsam:= = 你們兩個去打一架啦XD 07/31 02:59
推 GTOKevin:這邊釣出不少專業人士出來 07/31 02:59
→ apflake:概念,所以反而在行銷上必須隱藏時脈,例如athlon系列 07/31 02:59
推 lwsun:糟糕,我得找個翻譯... 07/31 02:59
→ suzukihiro:那個叫做PR值吧 07/31 03:00
→ SILee:不過灌進CPU的clock,CPU內部還會作升頻和除頻就是了 07/31 03:00
推 OpenGoodHate:有紫外線抹除的ROM拿來看看就知道什麼叫DIE 07/31 03:00
推 eterbless:找翻譯沒用 這要從cpu結構開始講起.. 07/31 03:00
推 james0850:白算盤!!白算盤!!白算盤!!白算盤!!白算盤!!白算盤!! 07/31 03:01
→ OpenGoodHate:不過看完裡面的程式也DIE光光,記得拿壞的來玩 07/31 03:01
推 ruemann:要看die的話,拿AMD的某一代CPU就是封一半,半顆die在外面 07/31 03:01
推 costbook:clock為什麼不用PLL送? <---底層達人 07/31 03:02
推 johnlinvc:有關clock就要從外頻和倍頻來說起了吧 07/31 03:02
推 PRAM:請翻譯 Blue who said, and whose. 這句話的中文 07/31 03:02
推 sunsonsam:把cpu的金屬蓋子拆開就看的到了不是嗎 07/31 03:02
→ sunsonsam:樓上不入虎穴焉得虎子 大概10年前的笑話^.< 07/31 03:03
→ kingofsdtw:回RPM: 誰鳥你@@? 07/31 03:03
→ ruemann:快爆了 快爆了 07/31 03:03
→ costbook:金屬蓋子底下那個是封裝好的IC 07/31 03:03
推 gg123sf:PRAM ..此英文非彼英文 07/31 03:04
推 PRAM:樓上年紀大了 (  ̄ c ̄)y▂ξ 07/31 03:04
→ SILee:現在clock不是都用PLL振出來的嗎? 07/31 03:04
→ costbook:die算是製程的術語,說明如上↑ 07/31 03:04
→ sunsonsam:我沒開過..之前看圖是DIE阿@@ 閃亮亮的耶 07/31 03:04
推 choupi:pram=Parallel Random Access Machine 很高深的complexity 07/31 03:05
推 dennis7653:看完這篇的心得就是...以後電腦有問題我都要寄站內信給 07/31 03:05
→ dennis7653:原PO 07/31 03:05
推 zoo3021515:給他爆 給她抱 07/31 03:05
→ SILee:閃亮亮那個是die上的散熱片吧 07/31 03:06
推 suzukihiro:報 07/31 03:06
推 ruemann:我爆啦 07/31 03:06
→ sunsonsam:被搶了... 07/31 03:06
→ SILee:真正的die很脆弱的 07/31 03:06
推 kof2200:平行 隨機 存取 機器 是嗎!? 07/31 03:06
推 feizizi:GKB是什麼機構啊??XDD 07/31 03:06
→ suzukihiro:顆顆 搶走了 07/31 03:06
→ zoo3021515:恭喜鈴木大得標 07/31 03:07
→ feizizi: 應該是神人呆的地方吧??? 07/31 03:07
→ kof2200:我只知道KGB 07/31 03:07
推 PRAM:是平行隨機沒錯 XD 板上高人雲集 07/31 03:07
→ poppyvodka:完全看不懂 謎之領域 \冏/ 07/31 03:07
推 kingofsdtw:XD~ 原來 Pram ~"~ ...我完全外行 07/31 03:07
推 costbook:我這裡還有幾顆EPROM和紫外線抹除機,可以看到die喔 07/31 03:07
→ ruemann:我只知道 GBK 07/31 03:07
推 vic81324:有料推 07/31 03:07
推 Cheer313:真專業 給你推 07/31 03:07
推 OpenGoodHate:裸裝晶粒應該只有紫外線ROM看的到,剩下都是封裝好的 07/31 03:08
→ vic81324:不過變成專業版了顆顆 07/31 03:08
→ SILee:有啦 現在很多生物晶片也都是裸晶直接拿來用 07/31 03:08
→ costbook:不過我把抹除機拿來幫襪子殺菌...(有用嗎?) 07/31 03:09
→ SILee:不過這東西市面上應該拿不到 07/31 03:09
推 nfsnfs:Good, 超棒~ 07/31 03:09
推 kof2200:sunsonsam 是的~~ 中間那粒!! 07/31 03:10
推 OpenGoodHate:裸晶不封裝要怎麼接腳位出來@@" 07/31 03:10
→ kingofsdtw:原來這就是生物晶片@@ 疑? 07/31 03:10
推 luckystrike5: 蓋 07/31 03:11
→ sunsonsam:對阿 那不就是CPU開蓋子的東西嗎QQ 07/31 03:11
→ kof2200:中間那粒外層還有包裝!! 07/31 03:11
→ SILee:那鬼東西是拋棄式的啊,用過一次就丟了 07/31 03:11
→ OpenGoodHate:連結算封裝過的不是嗎 07/31 03:12
→ kingofsdtw:把 KY弄掉後.. 用指甲刮 就可以看到 裸晶@@? 07/31 03:12
→ SILee:而且那只是用來檢測蛋白質的晶片,灌個操作電壓進去而以 07/31 03:12
推 upbed:專業推 計算機組織跟計算機結構學得很好唷XDDD 07/31 03:13
→ SILee:還拿去封測廠封裝太耗成本了,所以通常都是裸晶直接上 07/31 03:13
→ kingofsdtw:我好奇的是 蛋白呈色如何用晶體取代@@? 商業機密? 07/31 03:14
→ OpenGoodHate:了解,我想到好像RFID的TAG沒上封膜前好像也是裸晶 07/31 03:14
推 kof2200:交大的校長說在座的各位可以上"高等 計算機結構學"了XD 07/31 03:15
推 aegis144:英文翻中文那會真的看不懂WW 07/31 03:15
→ SILee:細節我也不太懂,我不是做這個的 07/31 03:15
→ kingofsdtw:了解>\\\< 07/31 03:15
→ kof2200:呼叫原po再來禪釋一下!!有問題了~~~ 07/31 03:16
推 choupi:原po可是CA助教級以上的人物呢... 07/31 03:16
推 finkel:CELL和CUDA的程式差很多吧 CUDA的程式不難寫..麻煩的地方其 07/31 03:16
→ SILee:只知道它主要是利用電場讓蛋白質依它的極性去排列和跑動 07/31 03:16
→ finkel:實是tool還不夠成熟..很難debug 07/31 03:17
→ kingofsdtw:不過..要怎樣讓晶片組直接判斷丟給cpu和gpu.(遐想中) 07/31 03:17
→ choupi:kingofsdtw biochip上面是一些binding就會變色的物質 07/31 03:17
→ choupi:finkel 我指的是programming/computing model 07/31 03:18
→ finkel:還有原PO提到的資料傳送時間的問題,其實換一個角度來想 07/31 03:18
→ kingofsdtw:所以 生物晶片的辨識儀器 也只是..高級的..辨色?!.. 07/31 03:18
→ finkel:運算和資料量都不高的程式 似乎也較沒有使用GPU加速的必要 07/31 03:19
應該說是總運算量高,但資料搬移的需求也多。
資料搬移未必是總資料量大,而是 cpu/gpu 協同工作的時候,
分工上有相依性,導致資料必須要搬來搬去的情況。
至少目前我會認為這種程式不適合用 cuda 架構來加速。
但有沒有加速的必要,我認為有。
至於 cuda 難不難寫... 我是覺得要寫得好還滿麻煩的,
必須要對 gpu 底層的運作有些了解才行。不了解當然還是可以照著寫,
程式也不會出錯,只是快不起來。這樣用 cuda 的價值就降低了。
→ kingofsdtw:3D遊戲資放:胃口是養大的.. 07/31 03:20
→ finkel:programming我是覺得差滿多的呀 就我自己寫過的經驗 07/31 03:20
推 LssFOREVER:看八卦長知識~~我絕到看到後面就像在看火星文 07/31 03:20
→ kingofsdtw:抱歉..我也是 局外人@@~ ..都問笨問題.. 07/31 03:21
→ kof2200:記得午夜過後好文才會有!! 07/31 03:21
推 costbook:這篇比我們計算機結構期末考還難 (羞愧) 07/31 03:24
推 keepoo:翻成中文我也會看不懂 幸好是用原文 07/31 03:25
推 kof2200:costbook你可以慶幸教授不會深夜爬起來看ptt的喔!! 07/31 03:25
→ costbook:教授目前出國,所以他應該起床了 XD 07/31 03:25
推 tonyselina:後面是到產業了,會考也是前面的部分吧 07/31 03:26
推 s4511981:這種文會爆 可見台灣真的很多人幹這行…… 07/31 03:29
推 kof2200:考教授什麼是ddr不知道會不會猜對!? 07/31 03:30
推 maxssn:是麥子大耶..有讀過計概或微算機應該看的懂.......名詞 XD 07/31 03:31
推 feizizi:東尼又跑來裝熟了 XD 07/31 03:32
推 costbook:怪了,我們用的書是Mano那本藍皮的,怎你們都用白算盤? 07/31 03:32
→ feizizi:請問麥子大大都在哪個版出沒啊?? 想多拜讀一下他的文章~~ 07/31 03:33
推 kof2200:costbook你哪間!? 07/31 03:34
→ feizizi:或是說請教一下版友 哪個版會有類似這篇文章內容的文章?? 07/31 03:34
推 decadentCat:拍謝挖跨攏謀.......... 07/31 03:34
推 stejiang:他常出現在魔獸版阿 被他電過 哭哭 07/31 03:34
推 tonyselina:奇怪,會喊我裝熟,但是我又不認識你,承認是愛豬肉了 07/31 03:35
推 maxssn:魔獸板 XD 07/31 03:35
→ kof2200:魔獸版的英文是!? 07/31 03:35
→ tonyselina:還真是神奇,整天用跳板,但是推文老愛露餡,可憐 XD 07/31 03:35
→ kof2200:哪間大學的計組是用Mano那本藍皮的啊!? 07/31 03:36
推 choupi:WarCraft 07/31 03:37
推 costbook:喔...我們是"科大"。藍皮書太簡單了嗎? 07/31 03:37
→ kof2200:掯~~~好難!!可以給校名嗎!?我馬上發email申訴!! 07/31 03:38
推 tonyselina:kof是在幹嘛? 話說轉這文去電蝦就超奇怪的 07/31 03:39
→ kof2200:增加知識!!獨樂樂不如眾樂樂~~ 07/31 03:40
→ kof2200:我每天晚上都熬夜蒐集一些很好的文章!! 07/31 03:42
推 kingofsdtw:爆!! 我只知道 三國版.. WarCraft! 07/31 03:42
推 suzukihiro:轉就轉了 有差嗎 07/31 03:45
推 kof2200:tonyselina你怎麼知道我用跳板!?你是我認識的嗎!? 07/31 03:50
推 e04su3:不是很懂 但看起來很專業 大家都推 我就推吧 07/31 03:54
推 kof2200:小弟錯了!!我刪除了~~~ 07/31 03:55
推 OpenGoodHate:<-stallings 培生 只上一學期 一整個沒印像的計組 07/31 03:57
推 vintw:除了OpenCL之外據傳微軟也在下一版的DirectX訂定類似的規範 07/31 03:58
→ OpenGoodHate:intel 推 Larrabee 想要在分散式領域幹掉NV 07/31 04:01
分散式指的是平行計算嗎? 如果能夠的話,希望能在別的板看到一些更細節的東西。
大家提出來的點都滿有趣的。 :)
推 vintw:在研討會上遇過的很多研究者對Larrabee抱有高度的期待 07/31 04:01
→ vintw:倒是ATi到目前為止都沒有實際動作,不知道下一步會是什麼 07/31 04:02
上次聽 amd/ati 的人演講,似乎也是要往 opencl 靠過去。但我還沒看到什麼具體作為。
推 germ611:快推...不然會被說我看不懂 07/31 04:03
推 OpenGoodHate:MS的好像是叫HLSL吧 用DX11的SHADER改的(上課印像) 07/31 04:06
→ OpenGoodHate:看了一下筆記,講反了,是HLSL→COMPUTER SHADER 07/31 04:08
推 james732:有看有推!! 07/31 04:11
推 Lindemann:推專業認真文 07/31 04:19
推 seiyaku:這才叫專業! 07/31 04:19
推 Waterpig:不推人家會說我們看不懂~~ 07/31 04:24
推 vkyoung:這篇只要稍具"電"字背景都可以看得懂, 很深入淺出的好文! 07/31 04:25
推 lolikung:推這篇,計組魂XDDDD 07/31 04:31
推 bomberhack:這篇的重點就是現在的硬體設計偏向硬體整合系統的 07/31 04:43
→ bomberhack:分工合作設計方式,藉以提高軟體的效能. 07/31 04:44
推 blackkane:我怎麼覺得重點是澇英文= = 單元 管線 南北橋 主記憶體 07/31 04:49
→ blackkane:週期 時脈..不懂為啥一定要打英文弄的文章看來就很難讀 07/31 04:51
推 Phater:有看有推 07/31 04:51
推 jeta890119:有些東西講英文比中文好懂 07/31 04:56
→ jeta890119:就像數位邏輯的:OR AND NOR NAND XOR 翻中文好懂嗎? 07/31 04:57
推 upbed: 或 及 反或 反及 互斥反或 07/31 05:08
推 blackkane:我知道阿 單元 週期 記憶體 英文會比較好懂嗎= =? 07/31 05:09
推 upbed: I know a Unit cycle memory 07/31 05:10
→ blackkane:instruction之間真的都是independent < 打獨立會難懂囧? 07/31 05:11
推 albert7387:推 完全看不懂 07/31 05:11
→ upbed: 指令 獨立 07/31 05:11
推 suzukihiro:有時候中文字你會混淆意思 尤其像管線 深度之類的 07/31 05:12
→ upbed:說真的喔~那個管線跟pipeline我覺得沒什麼關聯= = 07/31 05:13
推 blackkane:我是說非必要性的啦= = 獨立和相依那個我看到覺得超蝦.. 07/31 05:13
→ upbed:講「生產線」還比較容易懂…當然樓上提的獨立打獨立會比較好 07/31 05:13
推 suzukihiro:可能跟個人習慣有關吧...或許被老闆要求成這樣 07/31 05:14
→ blackkane:管線這名詞翻譯不是解釋意思 反而像是形容一種觀念想法 07/31 05:14
→ suzukihiro:自然而然寫出來就變這樣了 07/31 05:14
→ blackkane:share 就打分享阿= = 弄得半洋半中的 閱讀很痛苦 07/31 05:16
→ blackkane:鄉民很愛推的 i有thing要跟you say 就很像這種文章.. 07/31 05:17
推 suzukihiro:其實還好...很多老師上課都這樣搞 07/31 05:17
→ suzukihiro:早就被苦毒慣了... 07/31 05:18
→ blackkane:我知道很多老師都愛這樣 可是不代表自己要這樣阿... 07/31 05:18
→ suzukihiro:大概是被影響到了吧 XDD 07/31 05:18
→ blackkane:上課教學表達是一種筆記方式 能快速表達當然是好 07/31 05:19
→ blackkane:但當打一篇文章時就應該要要求用字遣詞了阿..= = 07/31 05:19
→ suzukihiro:或許有人喜歡用口語化來打字 這是個人習慣 07/31 05:20
→ blackkane:我生活笑的音是呵呵 阿我不就可以打注音ㄏㄏ 更傳神? 07/31 05:21
→ erasermyself:我跑來電蝦版了嗎 07/31 05:21
→ suzukihiro:我也不能說他不對 這是他的習慣 我沒什麼資格要求她改 07/31 05:21
→ suzukihiro:我又不是他老爸老媽老師之類的 07/31 05:21
→ blackkane:也許吧= = 但不管中英 內容是很正確的 pipeline解釋不錯 07/31 05:22
→ suzukihiro:可以阿 你打ㄏㄏ我也沒意見 顆顆 07/31 05:22
→ blackkane:沒要他改阿 也沒說他錯阿 推文不就舒發自己心得用的.. 07/31 05:23
推 suzukihiro:那就對啦 顆顆 07/31 05:24
推 suPerFlyK:(′・ω・‵) 07/31 05:37
推 jeromeshih:推原po分享文 07/31 05:39
推 sandowZ:我竟然看得懂.... = =" 07/31 06:39
推 neofire:這篇好像也沒什麼吧....四年多前的pcdiy有相同的東西 07/31 06:48
→ neofire:不過人家雜誌的內容頗有水準,不會連製程,單位,都不會打 07/31 06:49
→ neofire:而且這種東西,隨便問一個從celeron 300 oc 500的玩家都弄 07/31 06:51
→ neofire:的出類似的心得,那些問題當初p4上市都有雜誌刊出這種論點 07/31 06:54
→ neofire:當時是2002年 07/31 06:55
推 jefflaii:這篇超專業的 07/31 07:05
推 PHINEAR:第三段總歸一句話,就是hazard的代價 07/31 07:25
推 PHINEAR:指令平行的部份還有superscalar這技術 07/31 07:29
推 roea68roea68:.........太專業了 07/31 07:31
推 ymsgcat:......我看懂了 07/31 07:45
→ gname:慘了... 我剛好都看的懂...我是不是很宅啊...>< 07/31 08:10
推 Darkword1987:超專業 07/31 08:30
推 woohyuk49:推麥大...超威 07/31 08:35
推 bearching:八卦的清流XD 07/31 08:37
推 parkerlived:Intel如果把nvidia吃下來的話....amd真的要哭哭了 07/31 08:37
推 zznkqb:寫得非常的清楚,八卦板果然是神出鬼沒的地方 :) 07/31 08:38
推 sohate5566:換句話說,Intel當時覺得netburst衝時脈已經不行了 07/31 08:39
→ sohate5566:所以又改回P3一樣的微架構繼續推新的產品 07/31 08:39
→ sohate5566:到了i7以後就換了另一種叫做QPI的架構了 07/31 08:40
我不太清楚 netburst 是什麼,但 QPI 應該不屬於微架構的一部份(吧?)
QPI 全名是 QuickPath Interconnect ,也就是互連的介面,
主要是用來連接處理器,輸出入單元跟記憶體。
並沒有牽涉到處理器內部的設計,所以和微架構不是那麼相關。
這個 demo 影片滿不錯的:
http://www.intel.com/technology/quickpath/demo/demo.htm
推 McHamburger:end 07/31 08:41
推 suzukihiro:SOHATE講的算是精華 XXDD 07/31 08:48
推 cpt:其實CPU市場萎縮是遲早的事情 AMD不另尋活路只會越來越慘 07/31 08:52
→ cpt:Intel早已布局和TSMC合作打ARM 自己的製程也往將來做SoC發展 07/31 08:53
推 wholewing:怎麼辦,我都看不懂QQ 07/31 08:54
→ cpt:再往更久的未來看 如果cloud computing開始主流化 整個軟硬體 07/31 08:56
→ cpt:市場生態搞不好都會重新洗牌 07/31 08:56
推 morris2:兄台在晶心上班嗎? 07/31 09:09
推 Maybetrue:專業 07/31 09:22
推 sohate5566:簡單說Intel過一段時間就腳位技術全都換一換繼續噱錢 07/31 09:29
→ sohate5566:Intel就靠洗腦跟技術大搬風就可以噱到一堆無知人的錢了 07/31 09:30
推 im5566:資工魂XD 07/31 09:30
→ sohate5566:所以說請板友們繼續買AMD不是沒有理由的,別讓AMD倒下去 07/31 09:30
→ sohate5566:...完了我會不會被Intel告啊囧 07/31 09:34
推 nfsong:感恩 07/31 09:34
推 Mizake:麥大推推 07/31 09:42
推 jimihsu:太專業了, 沒八卦.......那 VIA 呢 ? XDDDDD 07/31 09:43
推 willwuwillwu:高手 好厲害 07/31 09:43
※ 編輯: sitos 來自: 140.112.31.132 (07/31 09:54)
推 gmlush:像這種東西翻成中文才會更多人看不懂...專業推 07/31 09:47
推 abucat:M系列是十年左右才有一次的改革....... 07/31 09:49
推 LucasChen:拜讀 07/31 09:51
→ syh7211:專業!!所以完全看不懂= = 07/31 09:51
推 asuka627:跨嚨某......太專業的關係? 07/31 09:54
推 TurtleBB:推一下,超專業。 07/31 09:57
推 ntcbacc:太專業了,我還請同事幫我翻譯 07/31 10:03
推 koibito1103:想問她要不要跟樓下的經濟學結拜 攻佔台灣理論市場... 07/31 10:05
推 BIGHEADXYZ:因為單就時脈來講,目前CPU的效能還是遠勝於GPU的 07/31 10:14
推 YouCantGetME:喔呵 是麥子 07/31 10:14
推 dragoni:推一下 07/31 10:15
→ BIGHEADXYZ:而且也不是什麼程式都能作平行,或許以後在設計演算法上 07/31 10:15
→ BIGHEADXYZ:都會朝著以平行的角度去思考吧:D 07/31 10:16
這種聲音現在很多。對於解同一個問題而最佳化的程式來說,
非平行程式的演算法在單一執行緒可能可以執行得很快,但可能無法平行化。
而平行程式的演算法在單一執行緒時可能較慢,但透過多個執行緒同時執行,
還是可以達到加速的效果。
能夠直接被平行化的程式,現在工具很齊全,要平行化相對起來比較容易。
但有很多演算法一開始設計的時候沒有考慮到平行化的問題,就變得很難處理。
因此對於解同一個問題而言,為了平行化而演算法整個重新設計的例子也不少。
這是可能是繼續榨出效能的唯一方法了。
因為單一處理器的效能可能快要走到盡頭了。
推 BIGHEADXYZ:單台電腦有OpenMP和CUDA叢集電腦有MPI,或許未來真的是 07/31 10:21
→ BIGHEADXYZ:平行程式的天下了吧? 07/31 10:21
現在幾乎所有的人都在推廣這件事,畢竟程式能平行化,
多核心系統才有用,多核心系統有用,大家才會買,整個電腦產業才會繼續走下去。
但事情也許不會那麼樂觀,如果景氣不好,低價低功率系統也會變成主流。
電費現在也是很貴的,一直衝效能未必符合市場的需求。
※ 編輯: sitos 來自: 140.112.31.132 (07/31 10:33)
推 lovetyrano:推 07/31 10:30
→ kondoyu:系統程式被當掉 哭哭 07/31 10:30
推 derayxu:同學注意! 這篇下學期的期中考會考, 請畫重點! 07/31 10:37
推 japan428:我小五的時候就看的懂了..... 07/31 10:46
推 stone0504: 07/31 10:50
推 kof2200:考台清交成研究所考生注意!!這篇明年研究考試會考XD 07/31 10:53
→ kof2200:台大去年資工的OS考的好機車!!可以申訴一下嗎XD 07/31 10:54
推 Deltaguita:那以後還會有專業繪圖卡跟一般顯卡的區別嗎? 07/31 11:03
其實我到現在還不是很懂專業繪圖卡跟一般顯卡的差別,我不是做影像處理的。
以之前粗略的了解,至少在 gpgpu 的架構底下,主要也只差在運算單元的多寡而已。
當然,多寡就決定速度,但兩者之間似乎沒有太明顯本質上的差別。
不過這應該要請對這方面了解更深的人來回答比較恰當。
→ Deltaguita:改個函式庫就能就差很多~ 以後還是會這樣? 07/31 11:04
推 Pumama:管線跟記憶體是必考題 這篇要讀熟 07/31 11:12
推 livilivilivi:怎麼辦我全部看的懂說~ 07/31 11:17
推 pkgo50:計組計結魂!! 07/31 11:20
推 mgdesigner:這是篇難得的專業文阿!順便回某些鄉民,計算機結構學 07/31 11:27
→ mgdesigner:本來就很深阿.... 07/31 11:28
推 qbaow:快推 不然別人會說我看不懂!! 07/31 11:30
推 OpenGoodHate:專業繪圖卡差在穩定度差很多 By:我的圖學老師 07/31 11:31
推 gcshin:看不懂…推一下裝懂好了 07/31 11:33
推 livilivilivi:禿然想到intel以前推過的VLIW,好像被搞的沒消沒息~ 07/31 11:34
VLIW (very long instruction word) 之前似乎是 intel + hp 在努力推廣。
代表作是 itanium 2 。在商用機器上面應該還是有不錯的表現,
但我沒有用過實機,身邊也沒人用過,不知道實際上的效能怎麼樣。
當然 intel 自己會說很好,不過用得人似乎沒有很多,那代表??
推 eddiewen:專業推! 07/31 11:39
推 abc0:那OpenCL跟Cuda會相容嗎? 07/31 11:39
OpenCL 還沒有制定完成,但以 wikipedia 上的資料, nvidia 也是發起者之一,
如果 nvidia 願意的話,應該是有機會可以相容或某種程度的互通。
不過偏軟體這方面我就不太熟悉了。
推 OortCloud:其實現在電腦會慢 都是卡在匯流排的頻寬不足.... 07/31 11:47
→ OortCloud:還有某個機械性結構的東西.... 07/31 11:48
解決匯流排問題可以另外再寫一篇了。其實也是一直都有進步,只是產品化的還不多。
推 coolfishman:看不懂 07/31 11:51
推 imprezasti:計組計結魂!! 07/31 12:02
推 lindet:XD 同學推 不愧是正教授! 07/31 12:03
→ applejone:其實有不少錯誤 07/31 12:11
哈,相信一定會有的。
推 Pash77:不能說錯很大! 只能說謬誤蠻多的... 07/31 12:12
→ Pash77:面積影響的是良率,不是成本,而且不是平方關係... 07/31 12:13
→ Pash77:全部看懂但不知道錯在哪的,CO/CA兩本都要重看了 07/31 12:14
良率會影響成本。當然說和面積呈平方是過於簡化,主要是想表達超線性的成長。
不同的製造過程,不同技術,影響的狀況也不一樣。這請半導體製程專業的人來講好了。
至少對做 CA 的人來講,目標就是讓面積變低,至於會變便宜多少,
倒是不太會仔細去估。通常會看到面積可以省幾 % ,但不太會去估錢會差多少。
推 garytsai:正教授+1 07/31 12:15
推 lindet:...面積影響良率 良率影響成本 好像沒錯啊 07/31 12:15
→ Pash77:面積跟良率的公式不是那麼簡單的關係,成本的計算當然錯了! 07/31 12:17
推 IntelC2D:推啊...! 07/31 13:05
推 huckebein12:雖然不是看不懂,但是真的沒必要打一堆英文衝專業度 07/31 13:07
→ huckebein12:打英文又不會比打中文快速,何必呢? 07/31 13:08
因為平常在打跟計算機結構相關的東西的時候,已經很少用中文在打了。
而且腦袋裡面第一時間浮現出來的也是英文的名詞,不是中文的名詞。
要轉成中文還需要花一點時間去想,才知道對應的詞是什麼。
其實這裡面寫的東西也沒多專業,用英文單純只是貪個方便而已。
看大家覺得這麼痛苦,下一次中英文都標出來好了。
推 showforce:計組魂啦!! 07/31 13:14
推 cityeffect:快推~不然別人以為我們看不懂~ 07/31 13:38
推 winble:推 07/31 13:55
※ 編輯: sitos 來自: 140.112.31.132 (07/31 14:00)
推 fish0612:看不懂耶 囧rz 07/31 14:55
推 alskdj:反正沒錢預算不夠都用不到 $$$$$$$$$$$$$$$$$$$$$$$$$$$$ 07/31 15:37
推 irix2007:我個人會賭OpenCL, 不想試cuda..不過M$不想加入OpenCL.. 07/31 15:48
推 ss60315:老實說我看不懂.. 07/31 16:22
推 padro:clock rate一直都跟pipeline有關 07/31 16:33
→ padro:在northwood之後 prescott更是深化到40 (沒記錯的話) 07/31 16:34
→ padro:因為分支預測錯誤上升 在低時脈反而會在效能上有更大下降 07/31 16:35
→ padro:prescott在超過3.8G的效能可以狂電northwood 07/31 16:36
→ padro:問題卻又無法解決clock攀升後造成的問題(本文內有提到) 07/31 16:36
→ padro:更正 prescott pipeline 31 stages 07/31 16:37
推 padro:另外 在Processor部分各家都有爭論 但PC上用的GPP使用指令集 07/31 16:43
→ padro:目前是被過去給綁死了 包含設計概念 07/31 16:43
→ padro:Cell使用的PPE+SPE概念其實是一個相對前衛的processor 07/31 16:44
→ padro:幾乎是朝向把GPP+GPGPU的概念整合 07/31 16:45
→ mamaka:中英文夾雜 昏了 07/31 17:15
推 CaoPi:推啊! 07/31 17:21
推 bigbigword:一半一上看不懂...囧 07/31 18:43
→ tinlans:我對 CUDA 沒興趣,H.264 的實作殘廢又跛腳。 07/31 18:43
→ bigbigword: 以上 07/31 18:43
→ tinlans:這種中英夾雜是好的,看過全中文專利真的是會昏倒。 07/31 18:44
推 BlueRacing:一年沒碰書我竟然還看的懂 XD 資工魂~~ 07/31 18:52
推 ddx:好文!推一個 07/31 19:23
推 wefun:縮短pipeline,增加 paralism數,目前看來這個策略是正確的 07/31 20:15
推 gmoz:GOOD 07/31 20:26
→ gmoz:資工的看不懂這篇該打屁股XD 07/31 20:28
推 cloudstr:快推 不然別人說我看不懂 07/31 21:39
推 DDR2:今天買了245~ 07/31 22:24
推 spfd:太專業了~看不太懂~不過還是推 08/01 09:44
推 sohate5566: 推 DDR2:今天買了245~ 08/01 10:03
推 philipwen:借轉 08/01 11:45
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.228.171.251
推 eggimage:太專業了 08/01 12:34
推 Farlang:專業文 推!!! 08/02 08:31