推 dos01: 不用砍啦 反正教授的錢也是花學校的錢 學校的錢也是花研究 03/30 17:35
→ dos01: 計畫預算 研究計畫的預算又來自繳稅的錢 然後你又遲早會繳 03/30 17:35
→ dos01: 稅 想想這其實也是花你自己的錢 直接買了啦! 03/30 17:35
→ encorek22554: 多卡訓練一直都跟nvlink無關吧 03/30 17:37
→ EEQQ102938: 如果batch大一點或模型大一點的話,一張卡24G可能不夠 03/30 17:39
→ EEQQ102938: 用… 03/30 17:39
→ Zenryaku: 實驗室不直接找廠商弄嗎… 03/30 17:40
推 sugoyeee: 板不需要a有更好的選擇 要拿d5就拿超過6000的 03/30 17:40
→ Zenryaku: 以後畢業了還被叩回去修電腦 03/30 17:40
→ EEQQ102938: 原文有說這是廠商報的單喔! 03/30 17:41
→ Zenryaku: 哦沒看到 抱歉 03/30 17:42
→ Zenryaku: 先把三星的ssd換掉 爛廠商問題一堆 03/30 17:42
推 rewisyoung: 20萬預算 有沒有考慮用GA100啊 03/30 17:42
這會爆預算吧…
→ Zenryaku: 電源不用兩台1200吧 哪吃那麼多電需要2400w 03/30 17:43
→ Zenryaku: 風扇可以不用買貓頭鷹的,而且這顆不是A12*25沒特別強 03/30 17:45
※ 編輯: EEQQ102938 (223.136.228.193 臺灣), 03/30/2023 17:47:22
→ Zenryaku: 然後記憶體也不用買芝奇的,芝奇也是特別貴的那種,時 03/30 17:48
→ Zenryaku: 脈至少買到6000 03/30 17:48
推 blacknate: 放個高速的HDD吧,SSD掛掉模型找不回來會嘔死 03/30 18:10
→ blacknate: 深度學習吃SSD的程度很可怕的,尤其是YOLO 那一類圖像 03/30 18:11
→ blacknate: 的吃很重 03/30 18:11
推 blacknate: 記得查一下你用的框架版本,萬一硬體太新不支援就哭了 03/30 18:13
推 cmcer: 怕掉資料就組raid吧 03/30 18:15
※ 編輯: EEQQ102938 (223.136.228.193 臺灣), 03/30/2023 18:16:58
推 blacknate: 樓上說得對,組raid,不然你光是保內把ssd操壞就有得受 03/30 18:17
→ blacknate: 了 03/30 18:17
推 johnjohnlin: 學校破10萬不是要公開招標嗎 03/30 18:20
→ johnjohnlin: 然後雙卡請買HEDT以上 03/30 18:21
推 mrme945: 這張主板不妥吧,只有第一槽是x16,下面兩槽都只有x4頻寬 03/30 18:23
→ mrme945: 而已 03/30 18:23
→ mayolane: 有破10萬要招標這回事嗎,儀器隨便幾十萬沒有聽說過招 03/30 18:26
→ mayolane: 標欸 03/30 18:26
推 mrme945: 主板直接用W680的吧,華碩那張也不貴,只是我也不知道這 03/30 18:31
→ mrme945: 兩槽那麼近能不能裝兩張4090就是了,另外記憶體看能不能 03/30 18:31
→ mrme945: 找到ECC的,跑起來比較穩,比速度重要多了 03/30 18:31
推 nasa930022: 實驗室經費自己買的不用招標吧 03/30 18:31
推 remia81: 建議先去TWCC測試一下你的訓練多卡到底能不能用 03/30 18:42
→ remia81: tf多卡訓練很謎 03/30 18:42
推 TingLinDick: 我也是配置兩張4090,但機殼因為怕散熱有問題,所以 03/30 18:46
→ TingLinDick: 是用礦機架加pcie延長線讓兩張顯卡有空間,兩張同時 03/30 18:46
→ TingLinDick: 跑的話會蠻熱的,所以機殼的散熱最好問一下廠商可不 03/30 18:46
→ TingLinDick: 可行 03/30 18:46
兩張4090可以share vram嗎?
推 bear1414: 主板不行 風冷佔3點多槽 你第二張卡只剩PCIe 3.0 x1 03/30 18:47
→ bear1414: 除非你用延長線 03/30 18:48
→ bear1414: 速度建議至少要有PCIE3.0 X8 (=PCIE4.0 X4) 03/30 18:49
→ bear1414: 另外你要跑的是哪個領域 CPU 13700系列就非常足夠了 03/30 18:51
推 bear1414: 訓練若單卡VRAM夠 多卡可以同時跑不同超參數的 03/30 18:56
→ bear1414: 提高效率 03/30 18:56
→ bear1414: 另外 你這台要放實驗室還是24小時冷氣server room? 03/30 18:58
會放在24hr 冷氣的server room喔
推 yenchieh1102: 實驗室來張A6000啊 03/30 19:16
→ bear1414: 現在A6000不好 要6000 ADA才夠快 03/30 19:16
※ 編輯: EEQQ102938 (223.136.228.193 臺灣), 03/30/2023 19:17:51
※ 編輯: EEQQ102938 (223.136.228.193 臺灣), 03/30/2023 19:18:11
→ EEQQ102938: 看下來目前應該是換主板,儲存從SSD換HDD,Ram換頻率 03/30 19:19
→ EEQQ102938: 高一點的嗎@@ 03/30 19:19
推 mesmerising: 實驗室拿一堆信仰外觀稅的零件好難懂 03/30 19:27
推 blacknate: ML重點是ram大才能做cache,頻率其實沒那麼重要 03/30 19:30
推 mrme945: 不是要你SSD換HDD,是要你多準備空間存放模型的,SSD壞掉 03/30 19:36
→ mrme945: 還有得救,SSD還是要有,只是換別家的吧,980Pro還有0E問 03/30 19:36
→ mrme945: 題 03/30 19:36
推 fuct: 為了你的畢業花那麼多錢喔,真好 03/30 19:36
推 GooglePixel: 怎麼不直接買server 效能非家用級能比 03/30 20:01
→ dos01: SSD你還是要有 HDD只是多放備用的 03/30 20:03
→ GooglePixel: 當我沒說 光一個data center等級GPU就爆預算== 03/30 20:05
推 Snowman: 10萬以上是可以選擇公開招標 100萬以上才是強制公開招標 03/30 20:07
推 johnjohnlin: 可是寫限制招標文件很麻煩 03/30 20:30
推 TingLinDick: 如果訓練需要較大的VRAM的話,我是用pytorch DDP去處 03/30 20:44
→ TingLinDick: 理,TF的沒用過 03/30 20:44
→ Aquarius126: 之前弄兩張3090塞機殼裡面熱到哭 只好弄礦架在外面跑 03/30 20:45
→ Aquarius126: qq 03/30 20:45
推 fuless: 怎麼看都像台信仰機 哪間學校碩 03/30 20:58
→ cor1os: 信仰?零件沒有AMD哪來的信仰(笑) 03/30 22:25
推 HotDogCC: 如果你今年確定畢業,買個pcie4的SSD用完就滾了,壞了 03/30 22:42
→ HotDogCC: 給學弟負責(x 03/30 22:42
推 kidd232: 這台太羊了 03/31 00:17
噓 jahnson: 實驗室禁用冷筍 03/31 00:34
推 GLTyang: 原來實驗室可以自己組電腦 我以為都會想要用工業電腦XD 03/31 10:55
→ GLTyang: DD 03/31 10:55
推 oppoR20: 實驗室可以用自組啊 看過不少台了 03/31 11:54
→ oppoR20: 不過通常都是找廠商報價 讓她幫你買零件 03/31 11:54
→ oppoR20: 讓她幫你組 最後有問題還是可以找廠商 03/31 11:55
推 dc0244: 記憶體拿6000以上的比較有意義t-create 6000 32G*2雙通道 03/31 13:08
→ dc0244: 這種的不貴 03/31 13:08
推 bear1414: 做深度學習記憶體速度影響不太 挑便宜的就可以了 04/01 12:50