推 jim543000: 洶寶<3220.141.227.192 02/12 20:28
→ narukaza: H11SSL-I只有PCI-E 3.0,你要確定耶, 114.34.174.204 02/12 20:45
→ narukaza: 還有沒有支援Resizable BAR,這H12才有 114.34.174.204 02/12 20:45
→ xiemark: 只用cpu跑,pcie沒關係 36.226.75.31 02/12 20:47
推 Supasizeit: 這一問一答要多久啊203.204.195.174 02/12 20:58
推 kamir: 要本地部署嗎? 111.71.19.118 02/12 21:08
→ kamir: 我是覺得個人玩家直接用線上的就好, 111.71.19.118 02/12 21:09
→ kamir: 自由度也高 111.71.19.118 02/12 21:09
推 YukilinnMigu: 這速度大概跟macmini跑速度差不多 114.40.170.168 02/12 21:24
→ MK47: 他是vram不是ram 36.235.228.45 02/12 21:28
→ moonlightz: 我記得H100要好幾張 114.42.66.181 02/12 21:29
→ xiemark: h100要8張,買不起。 36.226.75.31 02/12 21:34
推 yocpswang: 肯定是淘寶或小黃魚買 114.33.180.131 02/12 21:34
推 observer0117: 用unsloth處理過只需要不到200G 220.132.247.29 02/12 21:35
→ observer0117: 我是用Z840,128G一萬多而已,再加 220.132.247.29 02/12 21:37
→ kuninaka: 線上一直斷線,根本不能用 36.239.110.87 02/12 21:37
→ observer0117: SSD、RAM、GPU 220.132.247.29 02/12 21:37
→ kuninaka: 你串MAC MINI會不會比較快? 36.239.110.87 02/12 21:37
噓 ntuee1803: 荒唐 114.35.216.206 02/12 21:37
→ observer0117: 不過顯卡不延長只能插一張 220.132.247.29 02/12 21:43
→ kuochuwon: deepseek 用CPU跑效率好嗎? 175.181.152.51 02/12 22:12
→ observer0117: 671b應該不太好,unsloth動態量化後 220.132.247.29 02/12 22:39
→ observer0117: 還可以,但是會有非預期EOF問題 220.132.247.29 02/12 22:40
→ diablohinet: 哇....@@ 36.225.75.10 02/12 22:41
→ promaster: 老黃下巴掉了 1.161.173.221 02/12 22:44
推 ocean920704: 我還是選擇api就好 111.246.98.177 02/12 22:48
推 tetani: 這不會慢死嗎? 111.255.254.9 02/12 22:49
→ tint: KTransformers可以參考一下 106.104.71.59 02/12 23:13
→ tint: 用GPU加速的純CPU方案 106.104.71.59 02/12 23:15
推 prag222: 最大的參數量拿單機去跑很慢拉 114.44.18.56 02/12 23:18
→ erisiss0: 哈哈哈哈哈哈122.100.112.197 02/12 23:21
推 croweva: 期待原po未來分享用cpu跑671b的效率 1.200.145.97 02/12 23:29
→ annboy: 老哥 買顯卡跑蒸餾完的不就好了 218.161.27.73 02/12 23:34
→ yinaser: 收張3090跑32b就好 42.77.54.183 02/12 23:50
推 lluck: 每天睡覺前問問題, 睡醒看回答嗎 XD 114.32.5.184 02/12 23:54
→ sasado: 已讀不回AI模擬機 61.230.111.115 02/12 23:56
推 boringuy: 線上跑就好了,不用蝦折騰 101.10.6.16 02/13 00:01
→ yam276: 笑了123.193.249.242 02/13 00:02
→ tc22: 可以用袐塔 111.241.83.149 02/13 00:49
推 doomsday0728: 什麼鬼 這樣要跑多久? 36.234.197.247 02/13 00:53
噓 xelnaga: ?????? 12.226.201.122 02/13 01:11
推 Lightee26: 有人也是epyc+ddr4,可跑3~4token/s 111.251.204.95 02/13 01:21
→ Lightee26: 比拿ssd跑快多了 111.251.204.95 02/13 01:21
推 stlinman: 先試試api吧!150.116.129.113 02/13 01:36
推 ArcherX: 蠻好奇這樣可以跑多快218.164.157.191 02/13 02:24
推 FreedomTrail: 跑7B還行,想跑671B? 1.169.201.211 02/13 03:07
推 a71245969: 推實驗精神,bilibili 有用transformer 101.12.19.79 02/13 03:52
→ a71245969: s 跑6.6 tokens/s 101.12.19.79 02/13 03:52
→ a71245969: Ktransformers 101.12.19.79 02/13 03:53
推 jboys75: 要怎麼看自己電腦的token數啊? 220.132.77.49 02/13 05:44
→ widec: deepseek動不動就過宅,是要怎麼用線上的 1.165.9.178 02/13 06:31
→ widec: 3060我看對岸是說大約每秒10 tokens 1.165.9.178 02/13 06:32
→ xiemark: 現在可以在3060上跑14b, 速度很好。用cpu 1.200.242.89 02/13 06:53
→ xiemark: , 可跑32b速度可以接受。 1.200.242.89 02/13 06:53
→ xiemark: 但是還是要用cpu 跑671b, 測試。 1.200.242.89 02/13 06:54
→ xiemark: 訓練ai確實一定要用gpu, 因為都是用fp32 1.200.242.89 02/13 06:57
→ xiemark: 或fp16來算。但推論都是經過量化的,多 1.200.242.89 02/13 06:57
→ xiemark: 以int8來算,cpu不見得不好 1.200.242.89 02/13 06:57
→ xiemark: 上面有人提到ktransformer, 也要先建一個 1.200.242.89 02/13 07:43
→ xiemark: 至少512gb dram的平台,再用4090加速 1.200.242.89 02/13 07:43
→ xiemark: 這次先讓它能跑起來就好了 1.200.242.89 02/13 07:44
→ SRNOB: 太貴。e5 26xxv4 x2 不過應該都被炒起來了 111.255.92.61 02/13 08:05
→ xiemark: 謝謝,xeon也會研究一下 1.200.242.89 02/13 08:36
→ Ceferino: 在前陣子ds剛爆紅時就在推特看過這種全 27.242.199.145 02/13 08:52
→ Ceferino: 載ddram用cpu跑的方案,記得那時看到是 27.242.199.145 02/13 08:52
→ Ceferino: 說大概5 tokens/s左右!? 27.242.199.145 02/13 08:52
推 keepgoingKH: 期待後續成果223.140.191.214 02/13 08:52
→ Ceferino: ktransformers聽說可以加速快30倍是真 27.242.199.145 02/13 08:54
→ Ceferino: 假? 27.242.199.145 02/13 08:54
推 guogu: 我記得很像有人用雙路cpu跑到13token/s 1.164.230.221 02/13 09:07
推 artjio: 我幫你問deepseek本人了,感覺不太行 1.170.220.230 02/13 09:24
→ NanaMizuki: ktransformers建議是ram至少1t 49.217.136.250 02/13 09:58
→ xiemark: 1-10 tps可以接受 114.44.253.57 02/13 10:23
推 arrenwu: 1tps 可以接受....猛 98.45.195.96 02/13 10:59
→ xiemark: 因為會寫程式去問它 114.44.253.57 02/13 11:07
→ xiemark: ktrans 需要GPU 24GB VRAM 和382GB DRAM 114.44.253.57 02/13 11:16
推 guogu: 這是為了玩還是工作? 2 3t/s真的不是人用的 1.164.230.221 02/13 11:57
→ guogu: deepseek自己的很塞可以用openrouter 1.164.230.221 02/13 11:57
→ guogu: 即使免費的也有10t/s 怎樣都比 2 3t/s強 1.164.230.221 02/13 11:57
→ guogu: deepseek網頁版看起來應該有個3 40t/s 1.164.230.221 02/13 11:59
→ guogu: 但有些問題光"想"它就能花上3 5分鐘 1.164.230.221 02/13 11:59
→ guogu: 用你這方案豈不得跑一小時 1.164.230.221 02/13 11:59
推 felaray: 網頁版的問題是現在服務常常不穩定 220.136.68.64 02/13 12:02
→ xiemark: 要建知識庫,不可能上傳網頁使用。 114.44.253.57 02/13 13:16
→ moguli: 雙路13token0.3版才出不過MoE限制6個=閹割 1.34.253.121 02/13 13:17
→ moguli: ktrans至少要用16GB以上的顯卡,看來要換 1.34.253.121 02/13 13:23
→ AIRURU: discussions/11765 118.170.254.65 02/13 23:46
→ AIRURU: 看這篇測q5的r1有4t/s 118.170.254.65 02/13 23:46
推 sina1: cpu跑ai模型?你是不是搞錯了什麼?223.139.100.117 02/14 10:15
→ xiemark: 推論本來就可以用cpu跑 36.226.75.31 02/14 11:10
推 kamir: 知識庫我用GOOGLE試算表一類的記錄, 111.71.19.118 02/14 17:52
→ kamir: 算線上嗎? 111.71.19.118 02/14 17:52
噓 chysh: 科技公司:原來AI這麼便宜的... 106.1.117.179 02/15 16:00
推 bitcch: 推論本來就可以用RAM跑 不過字就是慢慢吐 49.216.90.102 02/15 22:30
推 fukku100: 這會慢到不行吧 203.204.16.137 02/16 00:42
推 NetsFan: 4060/3060ti 跑8b版本很快 供參 39.9.65.16 02/16 10:11
推 AmigoSin: Ktransformer參考一下223.140.151.246 02/17 02:15