看板 Gossiping 關於我們 聯絡資訊
餓死抬頭,阿肥外商碼農阿肥啦! Deepseek其實一直以來主打的用戶就不是對外面向全面通用型的服務公司,其實以當前純開 源讓企業用戶可以自架的模型來說,DS v3 0324還是很好用的,拿來做合成數據或是自架自 家的Agent flow都很香的,尤其是當前v3.2 Exp採用DSA架構(簡單理解就是把超長文本在 進入模型的時候直接濃縮,優勢在於這樣可以大幅減少超長文本計算量,可以把企業的上百 頁的ESG文檔直接餵給他朔造公司專用的AI文檔查詢系統還保持跟3.1一樣的速度跟計算量) 。如果要規避政府單位不給用DS還可以用DS來生成大規模的合成數據做蒸餾給GPT-oss這種 小模型再做Negative Sampling提取數據,像這種專用領域搭配RAG目前實驗都可以有效提升 小模型的準確率,中國口癖這種也用一些小模型直接採樣拒絕掉。 尤其是像Claude最近改動了用戶規範為了讓他能合法使用用戶資料而犧牲隱私,真的不要覺 得美國公司就不會出賣個資,企業為了利益、他國政府為了自身利益沒有什麼是不能賣的, 開源優勢就在於企業能掌握自己的技術跟價值。 差不多4講 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.216.233.111 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1759650857.A.238.html
error405: 廉價堪用 很中國114.36.233.19 10/05 15:55
jobintan: 口合,真用開源的,也要用馬老闆的Grok217.138.220.94 10/05 16:00
jobintan: ,這才是真開源。217.138.220.94 10/05 16:00
Grok3也沒有開源,Grok-2馬斯克也只提供權重而已,訓練方法也沒提供,很多東西最後老 馬都膨風,沒看到他後來也不太敢說自己是真開源。
GivemeApen: 直接開源表示可以抓下來自己改造39.15.48.155 10/05 16:00
pooznn: 也只有訓練用的標記資料和部份模型開源吧111.240.29.248 10/05 16:06
※ 編輯: sxy67230 (49.216.233.111 臺灣), 10/05/2025 16:06:49
potionx: ai未來是大者恆大的局面 搶不贏只能撿渣 118.166.71.176 10/05 16:57