看板 GameDesign 關於我們 聯絡資訊
不少遊戲初期公布的實機技術demo與最終成品有明顯畫質落差,為什麼? 本文將藉由說明在初期技術展示與最終成品階段的技術差別,來回答這個問題 順便介紹一些The Last of Us Remastered (PS4)壓榨硬體資源的技術 簡而言之:遊戲最終成品,通常所需運算資源種類與量,會比初期技術展示多 一個AAA遊戲成品在實機執行的時候,運算資源大致分配給以下幾項作業 1. 遊戲機制(CPU) 2. AI(CPU) 3. 物理(CPU and/or GPU) 4. 動畫(CPU) 5. 粒子(CPU and/or GPU) 6. 繪圖邏輯(CPU) 7. 繪圖執行(GPU) 初期實機技術demo,通常不會有多少1/2,可能會有3 4不會像最終成品消耗CPU與記憶體 所以大部分的運算資源都可以用在5/6/7 不要小看1/2/3消耗的資源量 這幾項在最終成品的資源消耗可以佔到CPU的50%以上 所以4/5/6/7能夠使用的硬體資源(粗估)只剩下初期技術demo的50% 如果在製作初期實機技術demo的時候 把100%硬體資源拿來展現4/5/6/7 那麼後來新加入1/2/3的資源消耗,勢必會產生"視覺上縮水"的情況 為了初期吸引觀眾目光,這幾乎是必然的結果 這樣是否表示AAA遊戲開發者不誠實? 見仁見智 不管是初期技術展示還是遊戲成品,硬體資源一定是幾乎被榨光的 製作初期demo的時候是否可以估計到之後會額外用到的資源? 非常難 不管是哪家工作室,應該都不想只用50%以下的硬體資源做技術展示demo吧 我個人是有了以上的認知之後 看到初期技術demo與最終成品的畫質落差 雖然會失望,但覺得比較可以接受這個事實了 接下來介紹TLOUR的一些壓榨硬體資源的技術 之前有提到,Naughty Dog為了從PS3跨到PS4 重新設計了一個平行運算的系統 負責人Christian Gyrling於今年GDC有個專題講座 強烈推薦給有興趣的資工領域朋友 影片連結 http://bit.ly/1eX5mb1 投影片連結 http://bit.ly/1HgtGQ9 TLOUR的硬體資源配置,可分為以下三種 1. 遊戲邏輯(CPU) 包含:遊戲機制、AI、物理、動畫、粒子 2. 繪圖邏輯(CPU) 生成繪圖指令,丟給GPU執行 3. 繪圖執行(GPU) 執行2生成的繪圖指令 一個單執行序的遊戲 1/2/3是串在一起,在同一個frame內線性依序執行的 如果要達到60fps,那1/2/3總共的運算時間就不可以超過16ms <A方案> CPU 遊戲邏輯 -> 繪圖邏輯 GPU -> 繪圖執行 |------------------------------| 16ms PS4有八個CPU核心,有六個是給遊戲使用的 把1/2平行化,拆給不同CPU核心執行 如此一來,1/2如果需要總共48ms執行時間,理論上只會用到8ms <B方案> CPU1 遊戲邏輯1 -> 繪圖邏輯1 CPU2 遊戲邏輯2 -> 繪圖邏輯2 CPU3 遊戲邏輯3 -> 繪圖邏輯3 CPU4 遊戲邏輯4 -> 繪圖邏輯4 CPU5 遊戲邏輯5 -> 繪圖邏輯5 CPU6 遊戲邏輯6 -> 繪圖邏輯6 GPU -> 繪圖執行 |--------------------------------| 16ms 但這還是不夠理想,CPU忙的時候GPU閒著,GPU忙的時候CPU閒著 開發AAA遊戲的精隨就是要最大幅度使用硬體資源啊! 那如果把遊戲邏輯在frame0生成的資料,暫存在記憶體 繪圖邏輯在frame1的時候用這些資料生成繪圖指令,交給GPU繪圖執行呢? 把遊戲邏輯和繪圖邏輯切成小塊,交互執行 所以感覺上遊戲邏輯和繪圖邏輯"同時"在一個CPU核心上執行 <C方案> CPUn 遊戲邏輯n (生成frame1資料) 繪圖邏輯n (使用frame0資料) GPU -> 繪圖執行 |-------------------| 16ms 嗯,光是視覺看來,就已經能夠更有效率地使用硬體資源了 但是CPU和GPU還是各有自己的閒暇時間,不行! 那如果更進一步,繪圖執行使用的資料,是繪圖邏輯上一個frame產生的呢? <D方案> CPUn 遊戲邏輯n (生成frame2資料) 繪圖邏輯n (使用frame1資料,生成frame0資料) GPU 繪圖執行 (使用frame0資料) |-------| 16ms 好了,CPU和GPU已經最大幅度使用,閒不下來啦 這個D方案就是TLOUR使用的技術 缺點就是,畫面是GPU使用兩個frame以前的舊資料呈現出來的"老畫面" 所以TLOUR是有兩個frame的延遲時間的 當玩家看到畫面上,準心瞄準敵人的頭時 從遊戲邏輯的觀點來看,敵人的頭可能已經不在準心下了 TLOUR彈藥普遍稀少,為了補償玩家,在射擊的時候 只要在過去兩個frame中有瞄準到目標,就算是判定擊中 D方案不是唯一解或最佳解,一切端看開發者考量 The Order: 1886採取的方式類似B方案(有將作業切小塊和生產線處理) 因為Ready at Dawn工作室明確表態,說不想要讓遊戲有任何延遲 所以如果他們願意採用D方案,The Order: 1886可以衝到60fps也不一定? -- Web http://AllenChou.net Twitter http://twitter.com/TheAllenChou LinkedIn http://linkedin.com/in/MingLunChou -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 45.50.175.11 ※ 文章網址: https://www.ptt.cc/bbs/GameDesign/M.1433725304.A.F8C.html ※ 編輯: cjcat2266 (45.50.175.11), 06/08/2015 09:17:31
yearnway: 謝謝分享~~又學到一些東西了~~ 06/08 09:53
yhn0tgb60: 過去2個frame有擊中都算 所以邏輯資料會保留2個frame囉 06/08 10:12
yhn0tgb60: 這樣會對記憶體造成負擔嗎 或是其實資料量很少 沒影響 06/08 10:13
cjcat2266: 既然遊戲生得出來,就表示記憶體可以負擔吧XD 06/08 10:14
cowbaying: 如果GPU的時脈拉到2GHz以上我推測可以用來算AI 06/08 10:24
cowbaying: 遊戲這種hard real time運算 對於平行後的資料蒐集 06/08 10:25
yhn0tgb60: 我的想法是 通常這個frame的資料出來時 06/08 10:25
cowbaying: 是相當嚴苛的... 06/08 10:25
yhn0tgb60: 上個frame的資料應該就丟了 甚至釋放了 06/08 10:26
yhn0tgb60: 所以這作法 必須保留3個frame 的資料 06/08 10:26
cowbaying: 或許是硬體特性的問題 目前開發的HSA項目 06/08 10:28
cjcat2266: 當然不是所有資料全保留啊,只保留繪圖相關資料而已 06/08 10:28
cowbaying: 在GPU時脈800Mhz下 簡易四則運算的回應時間是 06/08 10:29
cjcat2266: 我們已經三個人在平行發言了XD 06/08 10:29
cowbaying: 1000~5000ns 比CPU慢了約100倍 06/08 10:29
cowbaying: XDDDDDD 06/08 10:30
cowbaying: 這就是沒有ordered的關係 06/08 10:30
cowbaying: 但是兩個frame的延遲我認為算很嚴重了 至少競技類 06/08 10:32
cowbaying: 的遊戲應用起來很困難 06/08 10:32
cjcat2266: 頑皮狗做的遊戲都是單人線性劇情走向,所以沒問題的XD 06/08 10:33
akilight: 不過TLOU和uncharted不是都有多人對戰嗎? 06/08 12:07
akilight: 對人對戰的部份也是用這種2 frame方式處理,還是改以反應 06/08 12:07
akilight: 速度為優先考量呢? 06/08 12:07
cjcat2266: 是使用同一套系統,畢竟射擊遊戲的被攻方錯誤容許度高 06/08 12:45
cjcat2266: 攻方如果發現有瞄準到的敵人沒有攻擊判定,會很明顯 06/08 12:46
cjcat2266: 而被攻方受到攻擊判定,也就只能認了 06/08 12:46
cjcat2266: 一般也不會覺得 "明明自己躲過瞄準了,怎麼還被打到?" 06/08 12:47
cjcat2266: 因為被攻方也看不到攻方的準星是否有瞄到自己 06/08 12:47
akilight: 了解XD 06/08 13:55
wyvernlee: 專業文! 06/08 14:43
holymars: 試著回答記憶體的問題:通常邏輯部份並不佔多少記憶體 06/08 16:22
holymars: 理論上,多存兩個frame的邏輯狀態並不會增加多少記憶體 06/08 16:23
holymars: 需求,至少和texture/audio之類動不動就上百MB比起來是 06/08 16:23
holymars: 很小的問題 06/08 16:23
cjcat2266: 也不用存邏輯狀態,只要存繪圖需要的transform就好 06/08 16:32
azureblaze: 記憶體幾乎就是texture的意思了 其他比起來都是渣XD 06/08 19:26
lemmii: 推好文 06/08 23:27
※ 編輯: cjcat2266 (160.33.43.15), 06/09/2015 01:01:44
wangm4a1: 推 06/09 02:16
yoyoleo0505: 推 06/09 08:51
yhn0tgb60: 邏輯資料的記憶體 的確是非常小沒錯 06/09 13:24
yhn0tgb60: 只是想到 videogame的記憶體也是寸土寸金 XD 06/09 14:33