


→ error405: 不對 前兩張應該是qwen2.5 01/10 15:43
→ error405: 一樣問qwen歌手3沒關思考模式 它還會考慮你的身分動機 01/10 15:45
→ error405: *問qwen3歌手 另外幻想文差異不大 01/10 15:46
https://huggingface.co/Qwen/Qwen2.5-1.5B-Instruct-GGUF/tree/main
2.5是這個 qwen2.5-1.5b-instruct-q4_k_m.ggu
※ 編輯: error405 (114.36.254.215 臺灣), 01/10/2026 15:48:18
→ Supasizeit: Qwen 3很威 VL超好用 01/10 16:01
→ ninggo: 小模型搭配RAG在有限範圍內會發揮的比較堪用 01/10 16:19
→ error405: 完整版模型應該比我這1.7B的強多了吧 01/10 16:26

推 YCL13: 我近期都是VL 30B A3B,前幾天試了NEXT 70B A3B就回不去, 01/10 18:43
→ YCL13: 不過這個我用kobolod跑不動,是改用lm studio來跑 01/10 18:43
→ error405: 我一開始就是試LM studio 結果CPU不相容 01/10 18:47
→ error405: 試了4B版 速度剩一半 果然文書機還是勉強 01/10 19:07
推 a159371153: 這個有沒有支援nsfw? 之前測試qwen3vl不支援nsfw,就 01/10 21:11
→ a159371153: 放棄了 01/10 21:11
→ error405: 我叫它生成精靈哥布林 但它的尺度就很一般向 01/10 21:17
→ error405: 大致就手指滑過 有種奇異的感覺 不會有重點部位描寫 01/10 21:18
推 YCL13: 如果要寫NSFW就算是uncensored模型也很難直接寫,還是要給 01/10 21:25
→ YCL13: 適當的preset才能越獄,但小模型光是讀懂那些preset就有困 01/10 21:25
→ YCL13: 難,所以我猜應該不容易有好效果 01/10 21:26
推 Supasizeit: Next 70B Q4要48Gb 你怎跑 01/10 21:58
推 kimwang: kobold之類的可以把一部份模型卸載到RAM裡 主機RAM夠大 01/10 22:01
→ kimwang: 就可以跑 但是速度會慢很多 01/10 22:01
→ kimwang: 我12GB VRAM也跑過大小18G多的31B Q4模型 01/10 22:02
→ kimwang: 只是速度慢加上跟Gemini之類比智力還是差不少 01/10 22:03
推 Supasizeit: 喔 那就喘了 01/10 22:04
推 patvessel: next不是80b嗎... 01/10 22:08
推 YCL13: 我是用雙顯卡+64RAM,可以跑Q4+32K上下文,因為A3B速度可接 01/10 22:32
→ YCL13: 受,比一般的30B模型快非常多 01/10 22:32
→ YCL13: 對喔,NEXT是80B模型,前面打錯成70B 01/10 22:34
→ error405: 拿1.7B要它生奇幻小說人名吐一堆玄冥無極蕭瑟 01/11 10:10
→ error405: 看來玄幻小說吃了不少www 01/11 10:10
→ error405: 指名要西式奇幻風格後好很多 01/11 10:28
