看板 PC_Shopping 關於我們 聯絡資訊
已買/未買/已付訂金(元):未買 預算/用途:用來跑DeepSeek 671b大模型推論機。模型大小404GB,需要全部載入DDR上用 CPU來算 CPU (中央處理器): 全新 EPYC 7K62 48核心96線程 2.6G 正式版 $7500 MB (主機板): 超微H11SSL-i 二手 $8900 RAM (記憶體): 三星DDR4 ECC REG 64G 2666 x 8 $1600x8 = $12800 VGA (顯示卡): 舊EVGA 3060 12G(已有) Cooler (散熱器): 6熱管金錢豹AMD epyc 散熱器 $850 SSD (固態硬碟): KIOXIA 鎧俠 Exceria G2 2TB M.2 2280 PCIe 3.0 ssd $3590 HDD (硬碟): PSU (電源供應器): 台達 金牌全模組650W $2890 CHASSIS (機殼): MONITOR (螢幕): Mouse/KB (鼠鍵): OS (作業系統): Ubuntu 其它 (自填): 總價 (未稅/含稅):$36530 CPU 主機板、DRAM在洶寶買。 是否有更好選擇 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.226.75.31 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1739363103.A.053.html
jim543000: 洶寶<3220.141.227.192 02/12 20:28
wsdykssj: https://www.bilibili.com/BV1REPqeFE6d 123.252.19.17 02/12 20:32
narukaza: H11SSL-I只有PCI-E 3.0,你要確定耶, 114.34.174.204 02/12 20:45
narukaza: 還有沒有支援Resizable BAR,這H12才有 114.34.174.204 02/12 20:45
xiemark: 只用cpu跑,pcie沒關係 36.226.75.31 02/12 20:47
Supasizeit: 這一問一答要多久啊203.204.195.174 02/12 20:58
kamir: 要本地部署嗎? 111.71.19.118 02/12 21:08
kamir: 我是覺得個人玩家直接用線上的就好, 111.71.19.118 02/12 21:09
kamir: 自由度也高 111.71.19.118 02/12 21:09
YukilinnMigu: 這速度大概跟macmini跑速度差不多 114.40.170.168 02/12 21:24
MK47: https://is.gd/u3VvxG 這連結你參考一下 36.235.228.45 02/12 21:26
MK47: 還有這個 https://is.gd/vKxtAT 36.235.228.45 02/12 21:27
MK47: 他是vram不是ram 36.235.228.45 02/12 21:28
moonlightz: 我記得H100要好幾張 114.42.66.181 02/12 21:29
xiemark: h100要8張,買不起。 36.226.75.31 02/12 21:34
yocpswang: 肯定是淘寶或小黃魚買 114.33.180.131 02/12 21:34
observer0117: 用unsloth處理過只需要不到200G 220.132.247.29 02/12 21:35
observer0117: 我是用Z840,128G一萬多而已,再加 220.132.247.29 02/12 21:37
kuninaka: 線上一直斷線,根本不能用 36.239.110.87 02/12 21:37
observer0117: SSD、RAM、GPU 220.132.247.29 02/12 21:37
kuninaka: 你串MAC MINI會不會比較快? 36.239.110.87 02/12 21:37
ntuee1803: 荒唐 114.35.216.206 02/12 21:37
observer0117: 不過顯卡不延長只能插一張 220.132.247.29 02/12 21:43
kuochuwon: deepseek 用CPU跑效率好嗎? 175.181.152.51 02/12 22:12
observer0117: 671b應該不太好,unsloth動態量化後 220.132.247.29 02/12 22:39
observer0117: 還可以,但是會有非預期EOF問題 220.132.247.29 02/12 22:40
diablohinet: 哇....@@ 36.225.75.10 02/12 22:41
promaster: 老黃下巴掉了 1.161.173.221 02/12 22:44
ocean920704: 我還是選擇api就好 111.246.98.177 02/12 22:48
tetani: 這不會慢死嗎? 111.255.254.9 02/12 22:49
tint: https://tinyurl.com/muttrn8d 106.104.71.59 02/12 23:12
tint: KTransformers可以參考一下 106.104.71.59 02/12 23:13
tint: 用GPU加速的純CPU方案 106.104.71.59 02/12 23:15
prag222: 最大的參數量拿單機去跑很慢拉 114.44.18.56 02/12 23:18
erisiss0: 哈哈哈哈哈哈122.100.112.197 02/12 23:21
croweva: 期待原po未來分享用cpu跑671b的效率 1.200.145.97 02/12 23:29
annboy: 老哥 買顯卡跑蒸餾完的不就好了 218.161.27.73 02/12 23:34
yinaser: 收張3090跑32b就好 42.77.54.183 02/12 23:50
lluck: 每天睡覺前問問題, 睡醒看回答嗎 XD 114.32.5.184 02/12 23:54
sasado: 已讀不回AI模擬機 61.230.111.115 02/12 23:56
boringuy: 線上跑就好了,不用蝦折騰 101.10.6.16 02/13 00:01
yam276: 笑了123.193.249.242 02/13 00:02
tc22: 可以用袐塔 111.241.83.149 02/13 00:49
doomsday0728: 什麼鬼 這樣要跑多久? 36.234.197.247 02/13 00:53
xelnaga: ?????? 12.226.201.122 02/13 01:11
Lightee26: 有人也是epyc+ddr4,可跑3~4token/s 111.251.204.95 02/13 01:21
Lightee26: 比拿ssd跑快多了 111.251.204.95 02/13 01:21
stlinman: 先試試api吧!150.116.129.113 02/13 01:36
ArcherX: 蠻好奇這樣可以跑多快218.164.157.191 02/13 02:24
FreedomTrail: 跑7B還行,想跑671B? 1.169.201.211 02/13 03:07
a71245969: 推實驗精神,bilibili 有用transformer 101.12.19.79 02/13 03:52
a71245969: s 跑6.6 tokens/s 101.12.19.79 02/13 03:52
a71245969: Ktransformers 101.12.19.79 02/13 03:53
jboys75: 要怎麼看自己電腦的token數啊? 220.132.77.49 02/13 05:44
widec: deepseek動不動就過宅,是要怎麼用線上的 1.165.9.178 02/13 06:31
widec: 3060我看對岸是說大約每秒10 tokens 1.165.9.178 02/13 06:32
xiemark: 現在可以在3060上跑14b, 速度很好。用cpu 1.200.242.89 02/13 06:53
xiemark: , 可跑32b速度可以接受。 1.200.242.89 02/13 06:53
xiemark: 但是還是要用cpu 跑671b, 測試。 1.200.242.89 02/13 06:54
xiemark: 訓練ai確實一定要用gpu, 因為都是用fp32 1.200.242.89 02/13 06:57
xiemark: 或fp16來算。但推論都是經過量化的,多 1.200.242.89 02/13 06:57
xiemark: 以int8來算,cpu不見得不好 1.200.242.89 02/13 06:57
xiemark: 上面有人提到ktransformer, 也要先建一個 1.200.242.89 02/13 07:43
xiemark: 至少512gb dram的平台,再用4090加速 1.200.242.89 02/13 07:43
xiemark: 這次先讓它能跑起來就好了 1.200.242.89 02/13 07:44
SRNOB: 太貴。e5 26xxv4 x2 不過應該都被炒起來了 111.255.92.61 02/13 08:05
zzahoward: https://tinyurl.com/29nvcw83136.226.240.114 02/13 08:29
zzahoward: https://tinyurl.com/3wzj6cwr136.226.240.114 02/13 08:35
xiemark: 謝謝,xeon也會研究一下 1.200.242.89 02/13 08:36
Ceferino: 在前陣子ds剛爆紅時就在推特看過這種全 27.242.199.145 02/13 08:52
Ceferino: 載ddram用cpu跑的方案,記得那時看到是 27.242.199.145 02/13 08:52
Ceferino: 說大概5 tokens/s左右!? 27.242.199.145 02/13 08:52
keepgoingKH: 期待後續成果223.140.191.214 02/13 08:52
Ceferino: ktransformers聽說可以加速快30倍是真 27.242.199.145 02/13 08:54
Ceferino: 假? 27.242.199.145 02/13 08:54
guogu: 我記得很像有人用雙路cpu跑到13token/s 1.164.230.221 02/13 09:07
artjio: 我幫你問deepseek本人了,感覺不太行 1.170.220.230 02/13 09:24
artjio: https://i.imgur.com/vDKw2Wt.png 1.170.220.230 02/13 09:24
NanaMizuki: ktransformers建議是ram至少1t 49.217.136.250 02/13 09:58
xiemark: 1-10 tps可以接受 114.44.253.57 02/13 10:23
arrenwu: 1tps 可以接受....猛 98.45.195.96 02/13 10:59
xiemark: 因為會寫程式去問它 114.44.253.57 02/13 11:07
xiemark: ktrans 需要GPU 24GB VRAM 和382GB DRAM 114.44.253.57 02/13 11:16
guogu: 這是為了玩還是工作? 2 3t/s真的不是人用的 1.164.230.221 02/13 11:57
guogu: deepseek自己的很塞可以用openrouter 1.164.230.221 02/13 11:57
guogu: 即使免費的也有10t/s 怎樣都比 2 3t/s強 1.164.230.221 02/13 11:57
guogu: deepseek網頁版看起來應該有個3 40t/s 1.164.230.221 02/13 11:59
guogu: 但有些問題光"想"它就能花上3 5分鐘 1.164.230.221 02/13 11:59
guogu: 用你這方案豈不得跑一小時 1.164.230.221 02/13 11:59
felaray: 網頁版的問題是現在服務常常不穩定 220.136.68.64 02/13 12:02
xiemark: 要建知識庫,不可能上傳網頁使用。 114.44.253.57 02/13 13:16
moguli: 雙路13token0.3版才出不過MoE限制6個=閹割 1.34.253.121 02/13 13:17
moguli: ktrans至少要用16GB以上的顯卡,看來要換 1.34.253.121 02/13 13:23
AIRURU: https://github.com/ggerganov/llama.cpp/ 118.170.254.65 02/13 23:46
AIRURU: discussions/11765 118.170.254.65 02/13 23:46
AIRURU: 看這篇測q5的r1有4t/s 118.170.254.65 02/13 23:46
sina1: cpu跑ai模型?你是不是搞錯了什麼?223.139.100.117 02/14 10:15
xiemark: 推論本來就可以用cpu跑 36.226.75.31 02/14 11:10
kamir: 知識庫我用GOOGLE試算表一類的記錄, 111.71.19.118 02/14 17:52
kamir: 算線上嗎? 111.71.19.118 02/14 17:52
chysh: 科技公司:原來AI這麼便宜的... 106.1.117.179 02/15 16:00
bitcch: 推論本來就可以用RAM跑 不過字就是慢慢吐 49.216.90.102 02/15 22:30
fukku100: 這會慢到不行吧 203.204.16.137 02/16 00:42
NetsFan: 4060/3060ti 跑8b版本很快 供參 39.9.65.16 02/16 10:11
AmigoSin: Ktransformer參考一下223.140.151.246 02/17 02:15
AmigoSin: https://apple.co/3KDa4vI223.140.151.246 02/17 02:15
AmigoSin: https://bit.ly/3CHRceN 這個才對xd223.140.151.246 02/17 02:15