作者ggg12345 (ggg)
看板Soft_Job
標題Re: [討論] 雲端計算的保衛戰--Mail Service
時間Fri Jan 8 13:57:17 2010
※ 引述《ledia (下班後才下棋)》之銘言:
: ※ 引述《Aurim (Who cares?)》之銘言:
: : 對這種希望雲端計算可以解決運算量的問題,我的想法是這樣:
: : 同價位GPU的平行運算能力比CPU好很多已經是不爭的事實,
: : 1000顆GPU平行運算能力比1000顆CPU的平行運算能力要好很多。
: : 如果再把bus/network的response time算進來,在追求最佳運算效能的前提下,
: : 個人以為用雲端計算來處理這種事情,先天就已經在網路傳輸的反應時間輸了一大截。
: 再更確切一點的問題是這樣的
: 當我們需要大量運算, 作用在大量資料上時, 該怎麼處理 ?
對於大量資料, 有的資料雖量多, 但是可以彼此隔離無關, 處理
這些藕連不多的各個子集資料, 處理的算法是隨各子集資料而各
個不同, 還是可以都適用同一算法.
最常被使用的就是資料量雖大, 但可以被分割成不太密切藕連的
子集, 而且使用同一種算法擺在不同處理機就能同時處理的 data
parallel .
對每個 E-Mail 做偵毒, 過濾廣告, 就是上面一個典型.
像 HINET 的 mail server 編號達 ms1 - ms99 , 就是最容易被
拿來批評效率與利用率, 被估為雲端計算的頭號對象.
: 請問 desktop GPU supercomputing 要怎麼處理 Peta 級的資料 ?
: 把 Peta 級的資料存成某種方式讓 desktop 去讀 ?
GPU 的一個優點, 就是 bitmap graphic display buffer 先天就是一個
很大的 shared memory , 如果 GPU 被設計成都能對這些 buffer 直接存
取, 數量不小的 GPU 就是個能高度平行處理的共用記憶體多處理機. 不
過, 就繪圖動畫的角度言, 畫面是可被分區分割的, 非鄰近區不會急速關
連變動, 雖然不是完全獨立無關, 但也是接近 data parallel. 要讓很多
的 GPU 都能同樣高速的共用所有 shared buffer 是沒有必要的.
SMP 機器不只共用記憶體, 還會有彼此高速通知的同步通訊機制, 這是彼
此分工又協調合作不可少的. 這種機器才能支援不同演算程式散布在不同
處理機做 task parallel 的工作.
: 先不算單點頻寬, 光是 I/O 需要一台電腦多少 overhead ?
: 當今天的運用還牽涉到大量的網路需求呢 ?
今天的 cluster computer 除了配置 gigabit ethernet 相互將電腦接在
一起對外, 通常還會使用 infiniband 設備彼此互接, 主要是infiniband
在同樣的傳輸速率外, 還有 short delay message/signal 的功能, 這是
配合快速 IPC 反應的需要. 有這樣的配置才能逼近SMP的task parallel.
像大海撈針這類找外星人或找特殊粒子訊號的事, 先天就像要在一堆宇宙
雜訊的信件中要找出某封外太空人寄來的信. 這些都是 data parallel
性質的事.
....
: 但是傳統 PC 再怎麼 scale 都還是 PC
: 如果我們能把這種 "不需要去操心加了多少硬體" 的 scalability
: 整個規模放大, 是不是能夠去解決一些原本很麻煩的問題 ?
號稱雲端的就是透過 internet 與自備外部高速光纖(如 google)連接,
每個貨櫃電腦內部也是自備高速通訊設備銜接大容量儲存裝置. 其組成
的主機板也都是量產又價廉的PC主機板. 但未必使用真正高速的 shared
memory 與 IPC 通訊同步機制.
這種商業服務模式就是其規模優勢, 是在其本業之外, 拿多出剩餘的資
源來吸引中小企業或跨國的大金融業. 也就是麻煩的建置管理或擴充的
事, 他包來做, 客戶付小租金不用煩惱.
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.115.4.12
推 luciferii:老師好像一直沒抓到人家討論的重點...冏 01/08 16:21
→ ggg12345:哈!替您明說好了:簡直是不受教化,學習有困難的化外網民. 01/08 17:26
推 jerryen:cluster = cloud? 01/08 23:15