Re: [討論] 雲端計算的保衛戰--Mail Service

作者ggg12345 (ggg)

看板Soft_Job

標題Re: [討論] 雲端計算的保衛戰--Mail Service

時間Fri Jan 8 13:57:17 2010

※ 引述《ledia (下班後才下棋)》之銘言： : ※ 引述《Aurim (Who cares?)》之銘言： : : 對這種希望雲端計算可以解決運算量的問題，我的想法是這樣： : : 同價位GPU的平行運算能力比CPU好很多已經是不爭的事實， : : 1000顆GPU平行運算能力比1000顆CPU的平行運算能力要好很多。 : : 如果再把bus/network的response time算進來，在追求最佳運算效能的前提下， : : 個人以為用雲端計算來處理這種事情，先天就已經在網路傳輸的反應時間輸了一大截。 : 再更確切一點的問題是這樣的 : 當我們需要大量運算, 作用在大量資料上時, 該怎麼處理 ? 對於大量資料, 有的資料雖量多, 但是可以彼此隔離無關, 處理這些藕連不多的各個子集資料, 處理的算法是隨各子集資料而各個不同, 還是可以都適用同一算法. 最常被使用的就是資料量雖大, 但可以被分割成不太密切藕連的子集, 而且使用同一種算法擺在不同處理機就能同時處理的 data parallel . 對每個 E-Mail 做偵毒, 過濾廣告, 就是上面一個典型. 像 HINET 的 mail server 編號達 ms1 - ms99 , 就是最容易被拿來批評效率與利用率, 被估為雲端計算的頭號對象. : 請問 desktop GPU supercomputing 要怎麼處理 Peta 級的資料 ? : 把 Peta 級的資料存成某種方式讓 desktop 去讀 ? GPU 的一個優點, 就是 bitmap graphic display buffer 先天就是一個很大的 shared memory , 如果 GPU 被設計成都能對這些 buffer 直接存取, 數量不小的 GPU 就是個能高度平行處理的共用記憶體多處理機. 不過, 就繪圖動畫的角度言, 畫面是可被分區分割的, 非鄰近區不會急速關連變動, 雖然不是完全獨立無關, 但也是接近 data parallel. 要讓很多的 GPU 都能同樣高速的共用所有 shared buffer 是沒有必要的. SMP 機器不只共用記憶體, 還會有彼此高速通知的同步通訊機制, 這是彼此分工又協調合作不可少的. 這種機器才能支援不同演算程式散布在不同處理機做 task parallel 的工作. : 先不算單點頻寬, 光是 I/O 需要一台電腦多少 overhead ? : 當今天的運用還牽涉到大量的網路需求呢 ? 今天的 cluster computer 除了配置 gigabit ethernet 相互將電腦接在一起對外, 通常還會使用 infiniband 設備彼此互接, 主要是infiniband 在同樣的傳輸速率外, 還有 short delay message/signal 的功能, 這是配合快速 IPC 反應的需要. 有這樣的配置才能逼近SMP的task parallel. 像大海撈針這類找外星人或找特殊粒子訊號的事, 先天就像要在一堆宇宙雜訊的信件中要找出某封外太空人寄來的信. 這些都是 data parallel 性質的事. .... : 但是傳統 PC 再怎麼 scale 都還是 PC : 如果我們能把這種 "不需要去操心加了多少硬體" 的 scalability : 整個規模放大, 是不是能夠去解決一些原本很麻煩的問題 ? 號稱雲端的就是透過 internet 與自備外部高速光纖(如 google)連接, 每個貨櫃電腦內部也是自備高速通訊設備銜接大容量儲存裝置. 其組成的主機板也都是量產又價廉的PC主機板. 但未必使用真正高速的 shared memory 與 IPC 通訊同步機制. 這種商業服務模式就是其規模優勢, 是在其本業之外, 拿多出剩餘的資源來吸引中小企業或跨國的大金融業. 也就是麻煩的建置管理或擴充的事, 他包來做, 客戶付小租金不用煩惱. -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.115.4.12

推 luciferii:老師好像一直沒抓到人家討論的重點...冏 01/08 16:21

→ ggg12345:哈!替您明說好了:簡直是不受教化,學習有困難的化外網民. 01/08 17:26

推 jerryen:cluster = cloud? 01/08 23:15