精華區beta VideoCard 關於我們 聯絡資訊
前言,這篇文章翻譯自AnandTech的一篇文章,原文鏈接在 http://www.anandtech.com/video/showdoc.aspx?i=3469 Hi Anand, 你和carrell的會面預約在明天下午三點,地點是ATI的Santa Clara辦公室五樓大廳。他 會告訴你那些770幕後的事情。 Chris 這封郵件來至於Chris Hook,AMD的公關。在ATI被收購之前,我和他在一起工作了好幾年 。 當我步出ATI Santa Clara辦公室的電梯時,我聽到背後有人叫我名字。我回過頭去卻發 現誰也不認識。不過這很正常,因為我是上了年紀的人啦,在這個行業裡已經乾了12年。 謝天謝地Carrell Killerbrew根據一張照片認出了我。至於他是根據哪張照片認出我的, 我不知道。可能AMD保留了Derek,Gary和我的照片,並把他們貼在牆上用於發洩怒氣。 我們往前走,進了一個小房間,裡面有一張桌子幾把椅子,桌子中央有一個麥克風。屋裡 除了我,還有Carrell Killebrew,Eric Demers, Mike Schmit和Mark Leather(牛人云 集啊,基本都是AMD的院士,可見這位Anand老兄面子很大)。這些人中的大部分我都沒有 見過,但是聽過他們的名字。 AMD和被收購之前的ATI,在有些事情上做得很差,比如讓 我們和他們最聰明的人交流這一點上。最好情況下我們能和technical marketing的人交 流,但是很少有機會能和主架構師或者院士打交道。但是今天,在這個房間裡,我發現我 和AMD和一群院士,一群最聰明的人在一起。 以前和我們談論GPU的都是市場部的那幫人,說話通常是市場部的那付腔調。他們對付媒 體的流程通常是這樣的:放些幻燈片,大侃遊戲是多麼重要,然後會談論些架構上的東西 ,放一些通常我們並不關心的性能數據,最後作個總結。這種方式相當老套。 Carrell, 卻不一樣。 Carrell Killebrew是RV770項目的領導者。他正是你期望的那類人:領導一 群工程師開發GPU。 Carrell作了開場白,他說今天所有的談話都會被記錄在案,他假設 所有人對這一點都沒有異議。他問我我想談什麼,他給我了一些話題以供選擇,比如GPU 未來的趨勢,GPU的架構,用GPU來實現視頻的轉碼等等。或者他和其他人,可以談談 RV770背後的故事。 Carrell最後提出的話題引起了我的興趣,我從來沒有想像過這一點 。當RV770在夏天發布的時候,我們想當然的認為這是款很好的產品,它攪亂了NV的架構 體系,給了我們在$200和$300美金價位最有價值的產品。那時我們探尋了Readeon 4800系 列的架構和性能,但是只花了一頁的篇幅來討論AMD的小核心(small-die)策略。 AMD過 去8年中一直致力於製造越來越大的GPU。但是在RV770上,AMD反其道而行之,但是那時我 居然沒有註意這一點。我隨意的提到這一點,談論了下這個策略和NV的策略的不同之處, 但是我沒有深入進去。 通常情況下,類似AMD這樣的製造商告訴我他們做了什麼事,我通常都會問“為什麼”。 當Intel向我介紹Nehalem的cache架構,我問他們為什麼要這樣設計並稍後發布了我的心 得。對4800系列的每一個方面,我們也做了同樣的事。 Derek Wilson和我花了幾個小時 給AMD打電話發郵件,我們試圖把我們的腦袋包裹起來,以便我們可以用自己的觀點來評 價RV770的架構。但我們都忽略了最重要的一點:設計GPU的策略。這篇文章我寫得很艱難 ,沒有圖表,沒有架構可以分析。我只是坐在這間房子裡,聽這些人談話,這些人在兩個 小時時間里和我分享過去三年他們幹的事情。我想把文章寫得客觀中立,我希望我會,因 為在那個房間里和他們的交流是我跟AMD或者ATI最好的一次交流。 序幕:讓全世界為之一振的槍聲(The Shot Heard Around the World,不知道怎麼翻譯, 汗) 讓我們回到2001年,那時ATI還是獨立的公司,正在設計R300(Readeon9700 Pro)。那時 NVDIA正統領著市場,ATI還不能推翻NV的王位。最初的Radeon是不錯的,但是糟糕的驅動 限制了其性能的發揮。 Radeon8500不能擊敗NV的GeForce4,Ti4200贏得了主流市場, Ti4600佔據了高端的王位。那時ATI正在討論Radeon和Radeon8500,公司內部認為要贏得 市場,就必須贏得光環效應。如果ATI可以製造出最快的GPU,就能增加品牌認知度並培育 品牌忠誠度,不只是賣出高端的GPU芯片,低端GPU的芯片的銷售也能因此受益。但是最重 要的一點是:那時高端產品的售價是$399--記住這一點。 ATI裡的每一個人都在思考他們 必須設計最快的GPU,擊敗NV,所以Radeon 8500的繼任者是一個大傢伙。 Radeon 8500採 用0.15微米工藝,大概有六千萬個晶體管。 R300仍然採用0.15微米工藝,但是有1.1億個 晶體管,芯片面積基本是Radeon 8500的兩倍。 GeForce4大概有6300萬個晶體管。即使NV 也不敢在150nm的工藝上造如此大的芯片。因此GF4的繼任者準備採用130nm的工藝。我們 都知道接下來的故事,R300最終被命名為ATI Radeon 9700 Pro,蹂躪了GF4。正如Intel 用Conroe蹂躪了AMD一樣。 R300的成功堅定了ATI的策略:為了擊敗NV,芯片面積要不斷 增大。以後每一代的GPU都要更大更快。 GPU的戰爭開始了。 重新評估策略:2005年設計RV770 記住導致成功的因素比記住成功更重要。 2005年ATI的處境和當初設計R300的時候相似。 R300的成功是因為ATI重新評估了製造GPU的策略。在那個時候,ATI決定造一顆大芯片來 贏得高端,並將其轉化為每一個價格區間都有競爭力的產品。值得一提的是R300的持續成 功還部分歸因於NVIDIA在GeForce FX上的失敗。這是ATI上演的完美風暴。 ATI造了一顆 最大的GPU,NV在其後的一段時間裡無法回應。正如Intel在試圖瘋狂提高P4的頻率時撞上 了功耗牆。但是2005年時,ATI開始發現GPU過於龐大了。設計週期越來越長,芯片面積不 斷增長。製造如此大的GPU已經不是那麼合算了。 ATI認為一顆非常大的GPU,如果沒有使用repair structures和harvesting(兩種技術我 稍後會討論)的話,只有30%是可用的。意即:對一片晶圓而言,每100個GPU只有30%是功 能完好,可以零售的。製造如此復雜的電路成本是非常昂貴的,那些fab的設備造價很容 易就達到數十億美金。所以不能讓如此多的晶圓被浪費。謝天謝地有技術可以讓30%可用 變成90%可用。第一種技術稱之為可修復性(repairablility)。其思想非常簡單:設計 冗餘單元。如果芯片某個功能單元包含10個流處理器,實際上要設計11個流處理器。如果 有瑕疵出現那麼我們可以啟用那個備用的流處理器。這種技術通常也用在片上內存( on-die memory)的設計上。這樣當某一部分出現問題時,不會導致整個功能單元不能用 。但是這個地方通常有個折中,如果你設計了太多的冗餘單元,那麼你就面臨著芯片面積 太大的風險,並且這些增大的面積對實際性能毫無貢獻。但是如果你設計的冗餘單元不夠 ,那麼你的良品率就不足。第二種技術稱之為Harversting,所有人肯定都很熟悉。其思 想是:假設一片晶圓上功能完好的芯片只有很少一部分,但是我們並不丟掉那些有瑕疵的 芯片,我們關閉某些功能單元,然後把他們當做低端芯片賣。例如,如果你設計某個功能 單元包含了10個流處理器,預期只有30%的產品是10個流處理器都可用,50%的產品可用其 中的8個。那麼你可以把8個流處理器可用的芯片當做稍微低端的芯片賣。因此這種方法使 得一片晶圓上80%的芯片都可用,如果可能的話,你還可以屏蔽更多的流處理器單元,使 得接近100%的芯片都可用。良率會隨著時間改善,如果你一直依賴於Harversting,那麼 這種方法最終會損害你的財務表現。在上面的例子中,隨著良率的改善,越來越多的芯片 10流處理器可用,但是你還是只能當成8流處理器賣。某種意義上說,值一塊錢的東西你 賣八毛錢。當然你也可以設計8流處理器的新版本,但是這會耗費額外的時間、金錢和工 程師資源。 GT200系列就是採用Harvesting技術的典型。 GeForce GTX 260就是GTX280的 Harvesting版本。隨著良率的改善,NV推出了GeForce GTX 260 Core 216。但是要注意並 沒有為GT200系列設計任何的冗餘單元。因此GT200系列的芯片上最多有240個流處理器, 如果240個流處理器不能用的話,那麼就當成GTX260或者core 216賣。與之形成鮮明對比 的是RV770系列,兩個版本的RV770功能單元的規格都是一致的,所不同的只有頻率和功耗 的不同。從芯片的角度來看,ATI不必通過賣縮減版本的產品來保證良率。注意,一家公 司是否採用Harvesting技術並不會影響終端用戶。在這種情況下,GeForce GTX 260 Core 216實際上對終端用戶是有利的,因為它具有和4870同樣的價值。但是它無助於改善 NV的財務表現,如果一家公司長期依賴於Harvesting策略的話,最終是要付出代價的。但 是我懷疑NV會在事情變壞之前用55nm的GT200版本使自己全身而退。 ATI並不想設計一顆 GPU過度依賴於靠repair和harvesting來提高良率。於是一個殺手級的論斷出爐:造這樣 一顆大的GPU並非最符合客戶利益。 旁注:設計GPU 在我們深入那些艱深的話題之前,有必要理清頭緒。 ATI設計RV770花了3年,這意味著始 於2005年。從芯片流片成功到最後的產品上市,中間需花費一年時間。另外的一年或是一 年半的時間用於設計架構。我現在在Santa Clara碰面的這幫人正在討論設計2012年的產 品。我們正在討論4 TFlops性能的產品,4倍RV770的性能。今天做出的決定會影響三年後 的產品,某種意義上說,這是一場巨大的猜謎遊戲。 ATI不知道NV在2012年推出什麼樣的 產品,NV也不知道ATI會怎麼幹。兩家公司只是單純的試圖設計出對客戶而言最好的GPU, 希望自己的設計能在性能,架構和功耗間找到完美的平衡。讓我舉個例來讓你認識到設計 時的討論有多激烈,Carrell,花了三週時間,每天晚上花三個小時來討論多少冗餘單元 應該放到RV770裡。為RV770設計冗餘單元給ATI的挑戰比以前的還要大,因為ATI不得不面 臨芯片面積有限制這個事實。只是簡單的增加冗餘單元,隨之而來芯片面積也增加,這樣 並不能奏效。 RV770裡的冗餘單元並不能增加性能,只會增加芯片面積。如果對一顆已經 很大的芯片而言,這點面積的增加不算啥,但是對一顆瞄準性能級市場,芯片面積被嚴格 限制的產品而言,這是一個巨大的挑戰。 設計一顆適合主流大眾的GPU 下圖是AMD在他的財政分析日上公開的圖。 對桌面CPU市場而言,性能級產品只佔7%左右。雖然這一部分貢獻了大量的營收,但是市 場的大頭是主流級的產品。 ATI在2005年就意識到這一點。高端的GPU變得越來越昂貴。 R300上市價格是$399,但是隨後我們看到$499, $599, $600的GPU。越來越高的價格是由 於越來越大的芯片面積,以及採用類似harvesting這樣技術,保證不論GPU有多大,營收 是穩定的。售價$399的R300同主流級的產品價格是足夠接近的,這使得ATI能夠花幾個月 縮減它的規模來佔領其他市場區間。但是現在,縮減高端GPU的規模來佔領主流級市場所 花費的時間已經增加到了6-9個月。到現在為止,我們仍然看不到採用GT200架構的中端產 品。 NV把GTX280的發布價格定在$600,然後花9個月時間製造出價值$200的中端衍生品, 這在ATI看來是在傷害消費者的利益(doing the market a disservice)。現在是時候來 重新審視這個策略了。 ATI不再想重新裁剪高端GPU的規模來製造中端CPU,他們想設計一 款在$200-$300價格區間中最有價值的產品。要這麼做就不得不推翻原來的策略,並且希 望NV在某種程度上不要採用同樣的策略。 打賭, NV會採用這樣的策略嗎 在2005年的春天,ATI有R480在市場上(Radeon X850系列)。它採用130nm工藝,是另一 顆130nm芯片R420(Radeon X800)系列的改進版。從R420到R480的演進是非常重要的,因 為NV會以此來推斷ATI未來的行動。 ATI仍然在設計R520,也就是Radeon X1800,但是正 如你們記得的那樣,它延期了。 R520的延期引發了多米諾效應,其後的每一個項目都受 到了影響,包括R600,當然R600的延期還有其自身原因。當ATI審視R520的時候,發現它 很大並且並不合算。因此在R520的基礎上設計R580的時候,ATI做了一個讓人意想不到的 改變:打破1:1:1:1的比例。在R520中,ALU:TMU:ROP:Z的比例是1:1:1:1,但是在R580裡 ,這個比例變為3:1:1:1。增加ALU資源但是不增加紋理單元和顯存帶寬。 ATI注意到,應 用程序對shader的運算能力的要求在增加但是對顯存帶寬的需求並沒有增加。這個改變使 得從R520到R580的演化遠比很多人想像中的大,包括NV。那時X1800並不是很有競爭力, 一方面因為它的延期,另一方面也因為G70的確很好。 Radeon X1900讓ATI重奪性能王座 。 ATI從R520到R580讓人意想不到的變化無疑激怒了NV,NV習慣把持性能王座,它肯定不 想王位被ATI奪去。在ATI內部,Carrell正在下一個賭注,他打賭NV會低估R580,NV會像 評估R480一樣評估R580。他打賭NV會被R580弄得大吃一驚然後弄出一顆比G70大得多的芯 片。 NV不想丟掉性能王座,G80會是一個怪獸。 ATI原計劃R520在2005的初夏上市,結果 是10月才上市,差不多晚了6個月。正如我之前提到的,這個延期使得後續所有項目都被 延期。整個R600家族都受此影響。 ATI估計NV的G71會比R520快20%左右,並且不會估計到 R580的改變。 此時,ATI正在計劃R600項目,知道這是一個大傢伙。最開始預估芯片面積18mm x 18mm, 然後變成19mm,然後是20mm。工程師一直在問Carrell,你覺得NV的芯片會比這還大?當 然會,因為他們不想丟掉性能王座,在R580之後他們當然要重新奪回。 R580的成功是否 會影響到G80的大小和功耗在ATI內部一直被討論。我很確定NV肯定會說他們的設計和ATI 毫無關係,但是明顯我們都知道ATI的地位,並且Carrell的預計是正確的,G80是一個大 傢伙。如果ATI要為G80的優秀負責,至少付部分責任,那麼ATI自己的死亡就是注定的了 。不只是因為G80優秀,還因為R600延期,延得太晚了。 R600仍然被R520的延期影響,並 且它自身還面臨做AA resolve的硬件單元有問題等一系列問題。即便不開AA,R600與G80 的競爭也很艱難。 ATI丟掉了性能王座,ATI最大的芯片不能和NV競爭,其後一年,ATI的 營收和市場佔有率都不斷下降。而與此同時,Carrell仍然試圖讓每個人都信服RV770的設 計走了一條正確的道路,贏得性能王座並不像R300那會就意味著贏得一切……那時,他的 論調聽起來就像是一個瘋子說的一樣。當Carrell和他的同仁們正在規劃RV770的時候,他 們預想RV770不只是和對手同樣大小的芯片相比要好,也要有足夠的競爭力。因為NV仍然 堅持造過大芯片這個模式。 Carrell相信G80的繼任者非常大,RV770有優勢,因為NV不得 不在設計上有很多改變。 Carrell和他的ATI同仁將會經歷他們生命中的驚奇時刻( Carrell and the rest of ATI were in for the surprise of their lives...,不知道 翻譯得對不對)。 如果不打破現狀,我們會很危險。在2005年,ATI和NV都面臨這樣的情況:造一顆最快的 GPU,並提供穩定的驅動程序,那麼就可以贏得市場。過去幾年中,ATI一直是這麼幹的。 但是在公司內部,有一些人認為是時候改變了。在很多方面ATI和NV都面臨不同的挑戰, NV從之前激進的工藝更新策略中汲取了教訓,GT200很有可能仍然採用老的,更成熟的工 藝,因此導致GT200的面積很大。 ATI選擇走一條NV沒有走過的路,製造工藝的演進更加 迅速,以此造出更小面積的GPU。競爭對手偏愛造一顆越來越大的GPU,ATI分兩面看待這 個問題,他們沒有遇到真正的競爭,他們可以乾任何他們想幹的事。對ATI而言,問題變 成,小核心策略奏效嗎? 今天我們很容易說:“當然”。但是你要明白那是在2005年,RV770的規格正在被草擬的 時候。想像坐在一大群人中,他們的工作一直是製造世界上最快的GPU,但是你卻要對他 們說,讓NV取得性能王座,讓NV獲得光環效應,我們要做的是設計在$200- $300價格段最 好的GPU。當時的情況就是如此。當然接下來就是白熱化的討論,是否ATI能把賭注下在不 再造一顆最快的GPU,而是造一顆稍微低端的GPU上。 ATI把圖形市場劃分為5個區間:狂熱級,性能級,平衡寄,主流級和入門級。在2005年夏 ,ATI決定瞄準性能級市場,而非狂熱級市場。你可以認為性能級市場正是2002年R300競 爭的市場。 R300 $399的價格和Rademon 4870 $299的價格很接近,而GTX280發布的時候 價格是$599。 ATI把這看作是策略上的改變,R300當時為了性能可以不管芯片面積,而 RV770不同,它面臨這芯片面積和功耗的明確限制。我們今天知道,ATI內部很多人對 RV770大開綠燈。 Rick Bergman,決定把他的職業生涯和RV770拴在一根線上,因為如果 RV770不成功,他要為此負責。 Carrell回憶Rick Bergman和一群人坐在桌子旁討論RV770 的場景;Rick把頭轉向Matt Skynner,問他是否認為這個策略可行,是否造一顆比NV的 GPU更小但是仍然能成功的GPU是可行的,是否我們能在性能級市場上製造光環效應。 Matt很顯然仔細思考了這個問題,他轉向Rick說,我認為我們能。 Carrell感到如果沒 有Matt Skynner的支持,ATI不可能走這條路。而Rick Bergman確保了RV770的項目被良好 執行。當然也有很多非常聰明的工程師,他們造就了R300和R580這樣的產品,但並不認同 這個策略。有些人會說,如果ATI不弄出個和GT200能真正單挑的芯片,遊戲就結束了。但 是Carrell這樣的人會說,這個策略是可行的,因為它是正確的方向。這就像政治,每一 方都認為自己的觀點是正確的,但是你只能選擇一個。並且兩方還要同處一個屋簷下,低 頭不見抬頭見。 部分人很沮喪但是整個團隊在繼續發展 整個RV770設計花了大約三年時間。這意味著當我們討論R600的失敗時,那幫工程師正在 設計RV770並對此持樂觀態度。當然,這很艱難,ATI因為R600完全丟掉了性能王座。 Carrell,Rick Bergman和其他人要求整個團隊忘記發生在R600上的事情,忘掉ATI丟掉 性能王座這個事情,致力於做好RV770。在我的整個採訪中,我一直能感受到這樣一個事 實:整個RV770團隊給ATI留下了深刻印象。整個團隊沒有分崩離析,儘管有不同意見,儘 管對向哪個方向走有過搖擺,但是整個團隊仍然團結有力。 ATI認為採取不追求絕對性能 的設計策略是有意義的,但是如果失去了光環效應怎麼辦?歷史上因為失去光環效應而失 敗的案例不甚枚舉。對此ATI制定了嚴格紀律,把歷史放在一邊,做我們認為正確的事情 。這不僅要求不受歷史的影響,還要同以前養成的觀念做鬥爭,即,要轉變這樣一種觀念 :在設計的時候從來不考慮芯片變大的限制。 ATI通過RV770取得的成功使我想起了Intel 的Atom設計團隊。每一個團隊成員在設計他們負責的模塊的時候都面臨著模塊大小的嚴格 限制,而這個限制從來不會被妥協。逆境中往往會湧現最好的人。在業界我聽過最好的故 事,就是Intel設計banias的工程師,以及ATI設計RV770的工程師全身心的投入工作,而 不管是否會被擊倒。激情以一種有趣的方式成為一個人最強大的盟友。 我們所有人都應該為把功耗當做免費的午餐而感到自責。 Intel設計了5年的處理器,從 來沒有考慮過功耗問題。設計GPU的傢伙同樣如此。在R300和R420的時代,ATI從來沒有考 慮過功耗。在那個時候,對功耗的估計是如此的微不足道以至於ATI甚至沒有找到一套好 的估計功耗的方法。設計一款TDP被限定的產品是不可能的。現在ATI的工具好了很多,現 在要達成功耗上的目標和達成時鐘頻率的目標或是芯片大小的目標沒有什麼不同。現在, 功耗不會有大的變化(想想為什麼高端cpu的功耗總是130W附近)。每一個人的設計都面 臨功耗的限制,現在面臨的問題是如何在功耗保持不變的情況下提高性能。現在我們的處 理器,無論是cpu還是gpu,變得更加高效,而不是傻傻的堆規模上去以此提高性能。架構 上面臨一個有趣的問題是,在一顆大約10億個晶體管的芯片里傳遞數據要耗費很多的功耗 。 Carrell告訴我在45nm和32nm階段,在FPU里傳遞數據的功耗和這個FPU進行乘法運算的 功耗一樣多。考慮到數據傳遞變成了一個越來越高功耗的任務,未來GPU的設計很重要的 一點是要盡可能的保持數據存儲在本地,減少數據傳遞到寄存器和片上緩存中。我們能看 到更多的本地寄存器(local register)以及更多的多層內存結構。隨著芯片變得越來越 複雜,把寄存器文件集中放到一個位置越來越困難。 ATI承認在R600的製造上犯了一個關鍵性的錯誤。在為R600選擇晶體管製造工藝的時候, 太執著於性能目標,為了獲取更高的時鐘頻率。這樣造成的部分後果是R600那糟糕的 performance per watt性能,這一點我們的評測文章也注意到了。從那以後,ATI重新專 注於功耗效率。當晶體管越來越小時,漏電也變成一個日益嚴峻的問題。有時候為了提高 那點效率而使得漏電很高並不划算。假設你有一塊100W的GPU,你願意其中的40W都是因為 漏電而被消耗掉嗎?還是你想要其中的80W用來真正幹事情,只有20W被浪費? Intel也同 樣汲取了P4的教訓。 只是一個小問題:我們需要新的內存技術 R600擁有令人難以置信的512bit顯存位寬,以此引出的問題是芯片面積很大因為你不得不 進行複雜的繞線(route)。為了達成RV770的芯片面積目標,ATI需要256bit的顯存位寬 。但是如果使用現在的顯存技術,256bit的位寬無法提供足夠的顯存帶寬來達成RV770的 性能目標。再一次想像那是在2005年,ATI決定完全拋棄過去贏得GPU戰爭的策略,即使這 個小核心策略的成功要依賴於一種新的顯存技術,在那時這個新的顯存技術甚至連技術原 型都沒有。那時GDDR5的規範還沒有最終確定,沒有測試設備,沒有界面設計,什麼都沒 有。只知道GDDR5可以提供GDDR3兩倍的帶寬,這樣就可以依靠256bit的顯存位寬達成一個 512bit顯存位寬的目標。這正是ATI想要的,所以ATI決定採用GDDR5. 不幸的是GDDR5能否在2008年夏上市並不只是取決於ATI,內存製造商也有很多問題需要解 決。 ATI投入了很多金錢和工程師資源來和內存製造商緊密合作,以確保不僅GDDR5的規 格要定下來,而且在2008夏GDDR5要可用,性能良好。注意只有RV770會用到GDDR5,這意 味著只有ATI來獨自推動這項新技術。 ATI做了很多工作來推動GDDR5,這是有風險的,即使RV770性能非常好,但是在上市時如 果顯存沒有準備好,RV770仍然不得不延期。 RV770嫁給了GDDR5,沒有其他選擇了。如果 GDDR5不能在3年內準備好並投入生產上市,ATI將面臨既沒有高端GPU,也沒有性能級GPU 的窘境。 如果GDDR5工作正常,那麼意味著RV770能夠成功,並且從另一方面來講,這是NV所不具備 的。當然,這是建立在ATI的小核心策略是可行的基礎上…… Dave Baumann拯救了Radeon HD 4850 ATI有這樣的習慣:從媒體中選擇好的評論員,然後招致到公司裡。我們的第一個圖形版 塊編輯,Matthew Witheiler,從杜克大學畢業後就加盟了ATI。在加盟ATI之前,他在 AnandTech度過了3年的美好時光。在ATI,他最終成為了最年輕的產品經理。另一個傑出 的評論員是Dave Baumann,來自於Beyond 3D。在Beyond 3D,Baumann在分析兩款彼此競 爭的產品時表現出了卓越的能力。他在ATI的一項主要工作就是在公司內部比較R600和G80 ,這是發生在2006年11月份的事情。很顯然,G80對RV770有重大影響。雖然當時架構已經 定了,但是時鐘頻率,電路板設計,顯存大小等等都是在2008年初才定下來。最初, RV770的目標是R600的1.5倍,現在回過頭去看,這是不夠的。在接下來的一年半里,1.5 倍R600的性能變成2倍R600的性能,最終達到了2.5倍R600的性能,而價格卻是位於$200 - $300這個區間裡。 Dave在2008年二月變成了RV770的產品經理。考慮到他加盟ATI並不 久,而且這個產品非常重要,這是件大事。 RV670讓我們看到了ATI重回競爭者的行列, 但是ATI需要RV770讓他們重回巔峰。 當Dave開始負責RV770的時候,很多產品的規格已經規劃好了。芯片已經從fabs裡流片回 來。在這個時候,ATI的工程師並沒有準備好或者並不願意再對規格做改變。 Baumann先 生認為RV770XT不錯(XT是HD 4870的內部代號),用他的話講,規格很完美。對4870的唯 一修改就是增加了第二條PCIe電源連接線,僅此而已。他關注的是另一個更重要的產品, RV770 Pro,即HD 4850,他認為規格有些低了。 讓我們來了解下ATI當時的處境。你的工程師團隊過去三年一直在設計一款可能失敗的產 品,因為這是同過去你所做過的完全不同的產品。你的上一代旗艦級GPU失敗了(R600) 。 RV670做得不錯,但是仍然沒有從NV手中搶到多少市場份額。你剛剛完成一款全新的 GPU的設計,但是這個年輕的產品經理卻告訴你必須要做些改變。對Baumann而言,這是有 膽識的行動,他並不看重臉面,他要的是幫助他的團隊贏得勝利。最後的改變迅速而容易 的發生了,這是發生在RV770上的真實故事。 Radeon 4850原來是256MB顯存,500MHz的核心頻率,900MHz的顯存頻率。 Dave堅持認為 4850需要512MB的GDDR3和625MHz的核心頻率,以及933MHz的顯存頻率。他不但堅持這個規 格,也使得工程師團隊信服了這個規格並做了改變。 Dave向工程師們論述為什麼要改變 規格以及市場需要怎樣的規格。在討論快結束時,他已經不需要說服他們了。闆卡和ASIC 團隊擁護這樣的改變。 如果沒有這樣的改變,4850不能對NV的GeForce 9800 GTX施加如此大的壓力,它的價格也 不會降得這麼快。 最後的小插曲:闆卡很快上市開賣 RV770的設計在2008年五月完成,六月開始製造。直到NDA解除那一天,公司內部仍然有人 感覺小核心策略是錯誤的。但是他們後來很快發現這個決定是多麼的正確,快得超出他們 想像。 Radeon HD4800系列最後遇到的一點小障礙發生在上市前一周。當Chris hook打電 話給我,告訴我一些4850卡已經在歐洲開賣,我們拿到了第一塊HD4850.ATI做瞭如下規定 :我們可以談論4850的性能,但是不能談論4870的性能和RV770的架構。在30小時之內, 我們發布第一份分析文章,做出了一個很明確的結論:ATI做了正確的事。 GeForce 9800 GTX的價格突然暴降,以便維持競爭力,但是即使如此也不夠,Radeon HD4850是 $199價位最好的卡。 從台灣回來我一直在思考一件事:ATI怎麼知道NV的計劃或者是NV怎麼知道ATI的計劃,所 以我很問得很直白:你們這些傢伙從哪兒得到這些信息?回答不出意外:台灣。所有的闆 卡製造商都知道兩家的信息並且常常共享信息。 ATI計劃推進他們這一成功的策略,通過觀察路線圖我們可以得知,當ATI發布RV770時, NV在G92上沒法大做文章。 NV力求GT200像G80一樣,他發布了一款全新的芯片,把價格定 得高高在上,那些農民可能在2010年的某個時候買得起它。已有的產品線已經足夠充實了 。 ATI幸運之處在於NV在2008年只有GT200,而且GT200的性能並不足夠強。 4850最初目 標是性能超過8800GT,擊敗9800 GTX並不是必須的,畢竟9800 GTX賣$300,而4850只賣 $200。4870的目標是擊敗9800 GTX。但是ATI沒有想到的是4870如此的優秀以至於打敗了 GTX 260。 ATI現在賣$300的卡可以和NV賣$400的全新設計的卡競爭。對ATI而言,RV770 是一塊蛋糕,美味超出預期。每個人都可以聞到它的香味,他們知道RV770會很好,但是 他們沒有估計到他會如此之好。 NV的反應非常迅速,坦白講,沒有哪個公司可以如此迅 速的反應,但是這不會改變ATI已經成功的事實。 現在沒有人質疑Carrell的想法,每個人都同意這個策略是對的。我的問題是:多久ATI會 再一次重新評估他們設計GPU的策略?第一次是2001年,造就了R300;第二次是2005年, 造就了RV770。什麼時候那些艱難的決定需要再一次做出?可能在2012/2013年前我們都看 不到策略的改變。接下來的問題是NV會對ATI的策略做出何種反應?黃仁勳並不會樂意接 受失敗,尤其是像這樣失敗。 NV仍然有很強的研發實力,過幾年我們會看到RV770是如何 影響NV的設計。可能NV也意識到小核心策略是對的,可能NV仍然堅持造很大的GPU,或許 第三種可能也存在,只是我們沒有想到。 接下來是什麼? 正如R300一樣,RV770的成功部分由於NV的失敗。與NV30不同的是,GT200並沒有延期,性 能也不是差得離譜。它只是價格太高了。 ATI製造出RV770很幸運,NV造了一顆如此巨大 的GPU,因為它迴避了兩個主要的風險:55nm和GDDR5。這兩點ATI都抓住了。下一輪的較 量並不輕鬆,NV採用了55nm,最終也會使用GDDR5。 ATI不可能每年都能發布4800這樣的 產品。即使現在NV試圖通過激進的價格策略拉近差距,但是仍然面臨沒有任何GT200系列 的主流產品的尷尬局面,在2010年之前都不會有。更別提把核心面積為576mm^2的芯片和 ATI的260mm^2的芯片賣同樣價格對NV財務的影響。 Carrell非常坦白的告訴我不可能每一 次都能做出完美的產品。他想這樣,但是現實中這樣是不可能的。有很多因素超出了ATI 或者NV的控制,但是有時候機會降臨然後又抓住了機會,就會造就4800或是9700 Pro這樣 的產品。 Carrell補充到,在那些外部因素的限制的範圍內,ATI能做最有競爭力的產品 。在各種情況的限制下,有可能做到最好。也許它不能成為完美的產品,但是可以成為一 款好產品。我特別問到RV8xx系列有何特別之處,他告訴我ATI有些非常有趣,非常創新, 非常有用的技術會用到RV8xx系列中。我想問更多,但是考慮到Carrell和其他ATI同仁給 我的信息,我不能太貪心。 還有Larrabee,最神秘的GPU,intel第一款可編程的GPU。自然的,我和Carrell在最後的 30分鐘裡談到了Larrabee。 ATI和Intel,以及NV,都認為數據級並行會變得難以置信的 重要。他是下一次計算機性能發展的新浪潮。我們還不清楚在桌面市場上數據級並行計算 會以何種方式進行,但是如果它發生,這是一件大事。這間屋裡的每一個人都對競爭對手 錶現了崇高敬意。像NV一樣,ATI把Larrabee看成非常像CPU的GPU。對GPU而言,最大的挑 戰是讓數據並行算法在GPU上能像在CPU上一樣實現。 ATI承認Intel在這方面有優勢,因 為Larrabee是基於X86的,對程序員而言,整個開發環境都很熟悉。 ATI相信自己的GPU同 Larrabee相比在性能上仍然佔優(巨大的優勢),但是Larrabee自出娘胎起就有編程上的 優勢。值得一提的是,無論誰製造GPU,ATI,NV或是Intel,程序員仍然需要重寫數據並 行的代碼。 ATI相信寫出高效的並行代碼需要一定功力,難度比程序員通常編寫的代碼要 高一個數量級。如果你能夠有效利用GPU的能力,你就能駕馭巨大的計算能力。你只需 $170就可以獲得大約1 TFLOPS的計算能力。如果你是個傑出的程序員,你當然知道如何看 待下一波浪潮…… 結語: Derek和我花了6460個單詞完成了4850和4870的評測文章。這篇文章我花了7788個單詞。 我所做的只是記錄了那些導致RV770誕生的決定。我們評測的那些產品,無論好壞,都耗 費了大量的心血。芯片架構師的生活是很艱難的,為某個產品嘔心瀝血三年,僅僅因為一 些錯誤決定就招致一些評測網站尖酸刻薄的評論。如果我搞糟了一篇評測文章,下週我總 是可以改正錯誤。如果一個芯片設計師設計了一個數十億晶體管的GPU,但是在市場上遭 致失敗,他/她必須要等幾個月或是幾年才有機會東山再起。我在想芯片設計公司是否會 提供心裡諮詢服務作為員工福利的一部分。 每一款芯片上市的背後都有數以千計的故事,無論好壞,它們中的大部分都不為人知。部 分原因是我們花瞭如此多的時間在產品的褒貶上以至於我們很少有時間來講述這些幕後的 故事。當然有很多公司並不樂意披露他們的消息。 Carrell給我這一級別的交流讓我三生 有幸,在這一點上,ATI/AMD讓我印象深刻。我仍然要謝謝這些人,我所遇到的工程師, 以及更多我沒有遇到的人。 NV也許對RV770團隊的努力並不樂意,但是我們都受益了。如 果你最終買了4800及其衍生產品,你已經知道你為什麼會充滿感激。如果你買了NV的產品 ,有很有可能少花了很多錢。我們常常說競爭對市場而言是好事,但是很少會有像RV770 這樣鮮明的案例來證明這一點。那些原來值$300的卡現在只值$200,一款全新的賣$400的 卡突然間降到了$300。消費者贏了,RV770的團隊瞄準了性能級市場,滿足了消費者的需 求。所有這些都起源於2005年,一些傢伙想要掀起一場變革。 後記:這篇文章翻譯完後感觸頗深,國內論壇總是充斥著偏激,浮躁,半罐水響叮噹的人 。如果我們能少一分浮躁,多一份冷靜,我們才能出現Beyond 3D這樣的論壇,也才會出 現像Dave Baumann這樣的人。希望大家能繼續滿懷熱情的進行自己喜歡的事…… -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.169.215.130
dif771:我竟然看完了.........推 12/10 21:03