看板 Stock 關於我們 聯絡資訊
-------------------------------發文提醒---------------------------------- 1.發文前請先詳閱[新聞]分類發文規範,未依規範發文將受處份。 2.連結過長請善用 https://goo.gl/ 縮網址,連結能不能點擊者板規1-2-2處份。 3.心得/評論請盡量充實,心得過短或濫竽充數將會以1-2-3&一行文規範水桶處份。 ---------------------------按ctrl+y可刪除以上內容。---------------------- 1.原文連結: ※過長無法點擊者必須縮網址 https://technews.tw/2019/08/20/cerebras-unveils-ai-supercomputer-on-a-chip/ 2.原文內容: 新創獨角獸 Cerebras 推出 AI 單晶片超級電腦,大型 AI 學習訓練可從數月降至數分鐘 作者 Evan | 發布日期 2019 年 08 月 20 日 13:47 | 位於加州的新創獨角獸公司 Cerebras 於 19 日公布據稱是世界最大的電腦晶片──晶圓 級引擎(Wafer-Scale Engine,WSE),以及有關這片保密約 3 年之久的晶圓級 AI 晶片 細節。儘管仍有許多懸而未決的問題,但這種新方法可能標誌半導體產業的重要里程碑, 畢竟在這個產業,歷來就受單一晶片遮罩尺寸的限制。 由 Cerebras 設計的 WSE 晶片外觀尺寸比標準 iPad 稍大。Cerebras 表示,從自駕車到 監控軟體,單一晶片就能驅動複雜的 AI 系統。然而某專家卻表示,在許多資料中心裡, 安裝這種創新證實是不切實際。 Cerebras 設計了一個由 84 顆互連晶片組成的晶圓,以當作用於計算與記憶體儲存的裝 置,並由超高速晶粒結構(ON-die Fabric)互連。雖然在晶片上打造一個超級電腦聽起 來是個極棒的主意,但製造晶圓級的晶片陣列並不適合膽小或才智一般的人。 此外,如果 Cerebras 的方向及做法是對的,那麼 AI 可能只是晶圓級整合的開始;因為 目前應用程式對效能的要求愈來愈高,並超過 CPU 能提供的效能。如果 Cerebras 完成 第一個 AI 導向實作後,能將注意力轉向浮點運算核心,那麼晶圓級方法就可能徹底改造 當前的高效能運算。 Cerebras 內含 400,000 顆核心,以台積電嫻熟 16 奈米製程為後盾 Cerebras 是由現任硬體架構師的 Sean Lie 和曾經擔任微伺服器新創公司 Sea Micro( 2011 年被 AMD 購併)創辦人兼執行長與現任執行長的 Andrew Feldman共同創辦。 Feldman 的新公司現在僱用近 200 名工程師,其中許多人都是 Sea Micro 的舊員工。 Cerebras 已募集逾 1.2 億美元資金,最近的市場估值達 8.6 億美元。當大多數 AI 半 導體新創公司專注於構建適用執行深度神經網路所需矩陣和向量處理的更高效運算核心陣 列和晶片內記憶體(On-chip Memory)時,Cerebras 決定直接跳過數學優化,反而全心 全意努力實現極端的可擴展性。 如同百度資深研究人員 Greg Daimos 所言,在超大資料集訓練大型模型將花費數月或數 年的關鍵路徑(Critical Path)運算時間,這使這類訓練對現有系統的任何真實世界問 題都不切實際。但 Cerebras 宣稱,其 WSE 晶片能將複雜資料的處理時間,從幾個月降 低到幾分鐘。 目前最強的桌上型電腦使用 CPU 約有 30 顆運算核心,至於功能最強大的 GPU 有多達 5,000 顆核心。Cerebras 推出的新晶片內含 400,000 顆核心,所有核心皆透過高頻寬 連接相互鏈結。Cerebras 表示,這使它在處理複雜的機器學習挑戰方面更具優勢,與其 他方案選項的組合相比,延遲更小、功耗更低。 Feldman 表示,Cerebras 已「克服了幾十年來一直讓晶片尺寸受到限制的技術挑戰」, 他更進一步指出,訓練學習時間的減少,更將整個產業進展的一大瓶頸徹底消除。目前 Cerebras 已開始供貨給少數客戶,但尚未透露晶片的價格。 Cerebras 在本週於史丹佛大學舉行的年度 Hot Chip 大會,分享了一些設計細節。晶片 是由台積電採用成熟 16 奈米製程打造的 300mm 晶圓切割而成。以下列舉元件的基本規 格: 2 兆顆電晶體 46,225mm2 晶矽 400,000 顆 AI 可程式核心 18GB 超快晶粒內記憶體(SRAM) 9 PB/s 記憶體頻寬 100 PB/s Fabric 頻寬 稀疏性本地最佳化(避免乘以零) 支援與 TensorFlow 與 PyTorch 等標準 AI 框架的軟體相容性 3.心得/評論: ※必需填寫滿20字 先進製程找台積電 成熟製程也找台積電 要不要其他人活呀 台積電16奈米製程良率應該高到誇張 才能這樣弄吧 這一"片"晶片毛利率應該蠻不錯的 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 172.104.70.233 (美國) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1566522952.A.476.html
deann : 16奈米.. 08/23 09:16
JuiFu617 : 怎麼不用7奈米 08/23 09:21
manlike : 和iPad一樣大的晶片☺ 08/23 09:26
mintsern : 晶片本身就比ipad稍大了,顆顆 08/23 09:27
arnold3 : 問題是放不進電腦裡 08/23 09:33
pponywong : 這一顆晶片 做起來應該不少錢 XD 08/23 09:35
TISH12311 : AMD:他抄我用膠水 08/23 09:35
zaqimon : 散熱片應該很大片吧 08/23 09:37
sdhpipt : 應該爆熱的 可以順便拿來煎牛排 XD 08/23 09:42
sdhpipt : 以後超級電腦都順便經營美而美的鐵板 XD 08/23 09:43
bitlife : 感覺這個的製造良率問題會使它無法使用先進製程 08/23 09:46
bitlife : 在1顆iPad面積內要做到傳統CPU良率100%的程度 08/23 09:47
xiemark : 啟用大量redundancy,測試後把壞的disable 08/23 09:47
sheng76314 : 背後是一堆印度工程師 我知道 08/23 09:49
abyssa1 : 良率小問題 設計段就可以解 散熱才是大問題 08/23 09:58
abyssa1 : 核心數400k 壞的核心SW繞過去即可 08/23 09:59
bitlife : 如果良率不夠形一堆浪費面積成本降不下來,會有搞頭? 08/23 10:02
bitlife : Intel牙膏擠不出來,並不是整顆晶圓做不出一顆好的啊 08/23 10:02
bitlife : 片 08/23 10:02
abyssa1 : 新創公司不太可能拿到7nm製程 08/23 10:11
linjeff82 : All Indians 核心 08/23 10:12
utn875 : 等驗證可行穩定再追求先進製程吧 08/23 10:27
doranako : 這種設計良率是個大挑戰 08/23 10:33
c1951 : 其中一顆晶片壞掉 會不會整台報銷?? 08/23 11:35
abyssa1 : 壞幾個核心根本不會怎樣,Fault tolerant design是 08/23 11:53
abyssa1 : 幾十年前就有的技術,AI加速這種高度平行化的東西就 08/23 11:53
abyssa1 : 是多做幾個元件,壞掉的繞過去,架構層,元件層都 08/23 11:53
abyssa1 : 做,良率越低就要多留越多redundancy不是特別難的 08/23 11:53
abyssa1 : 技術,散熱才難解,水冷之外也就只能降頻。 08/23 11:53
bla : Skynet 08/23 12:25
jerrychuang : 搞笑用的晶片 08/23 12:54
heavenbeyond: 用16奈米製程做出來大小如iPad,那用5奈米製程做出 08/23 13:18
bitlife : 用redundancy這顆晶片的spec一開始要怎麼開? 4核心 08/23 13:34
bitlife : CPU做壞了,可以降成2核心賣,那是因為CPU腳位就是那 08/23 13:35
bitlife : 樣,而且就用降的規格去賣.你假設配合良率規格開90%, 08/23 13:35
bitlife : 萬一某批只有80%,要怎麼賣給客戶?浪費20%的面積真的 08/23 13:36
bitlife : 有多賺? 08/23 13:36
bitlife : 浪費20%不是指晶片良率,是這片iPad大小的AI晶片 08/23 13:37
bitlife : 整片晶圓 08/23 13:38
jerrylin : 7奈米很貴ㄟ 08/23 13:43
swhigh : 18GB SRAM 感覺不太夠,可能還有一些特殊架構,並非 08/23 14:07
swhigh : 只是純暴力 08/23 14:07
SantaNM : 因為我懶得dicing 08/23 16:18