看板 Stock 關於我們 聯絡資訊
這篇文章的核心意思就是 我們掌握著一些竅門,可以提升回答質素的那些,我們早就實踐,而且怕被快速追上,所以把他們閉源了 但是這些訣竅被中國人自己研究出來了 還有一些技巧,早就可打破一味堆算力的瘋狂勢頭,但是為了保護美國七巨頭現在 極好的股票上升勢頭。我們把它們擱置了,ds一出,我們不得不把低成本部署的算法都拿出來準備實施了 現在的問題就是,一直靠堆算力堆數據堆電力就能到達AGI的幻境破滅了 投資人的狂熱消散了。起碼第一波狂熱終於被點破了 ※ 引述《Lushen (pttlushen)》之銘言: : OpenAPI 的 Chief Research Officer (首席研究員) : Mark Chen 2025/01/29 凌晨發了一波推文評價 Deepseek R1 的論文 : https://i.imgur.com/A73X07x.png : https://i.imgur.com/rjDczVH.png : 恭喜 DeepSeek 產出了一個 o1 級別的推理模型!他們的研究論文顯示,他們獨立發現了 : 一些我們在通往 o1 道路上所找到的核心理念。 : 不過,我認為外界的反應有些過度,特別是在成本相關的敘事上。擁有兩種範式(預訓練 : 和推理)的一個重要影響是,我們可以在兩個軸向上最佳化能力,而不是只有一個,這將 : 帶來更低的成本。 : 但這也意味著我們有兩個可以擴展的軸向,而我們計劃在這兩個方向上都積極投入算力! : 隨著蒸餾(distillation)技術的成熟,我們也看到降低成本和提升能力這兩者之間的關 : 係越來越解耦。能夠以更低的成本提供服務(尤其是在較高延遲的情況下),並不代表能 : 夠產生更強的能力。 : 我們將持續改進模型的低成本部署能力,但我們仍對研究路線保持樂觀,並將專注於執行 : 計劃。我們很興奮能在本季度及今年內推出更優秀的模型! : Congrats to DeepSeek on producing an o1-level reasoning model! Their research : paper demonstrates that they’ve independently found some of the core ideas : that we did on our way to o1. : However, I think the external response has been somewhat overblown, : especially in narratives around cost. One implication of having two paradigms : (pre-training and reasoning) is that we can optimize for a capability over : two axes instead of one, which leads to lower costs. : But it also means we have two axes along which we can scale, and we intend to : push compute aggressively into both! : As research in distillation matures, we're also seeing that pushing on cost : and pushing on capabilities are increasingly decoupled. The ability to serve : at lower cost (especially at higher latency) doesn't imply the ability to : produce better capabilities. : We will continue to improve our ability to serve models at lower cost, but we : remain optimistic in our research roadmap, and will remain focused in : executing on it. We're excited to ship better models to you this quarter and : over the year! : : 喊得很大聲,做出來的不過就那樣 -- 當心,被擊沉的推文跟班有: LiXX FaXX LuckXX DrGXX shiriXX downtoearXX stanthemXX liweitseXX -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.89.14.114 (中國) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738199290.A.AFD.html
laptic : 所以人家的「蒸餾」說 不敢正面回應?(如算式等) 01/30 09:09
ggian123 : 美國狗輸不起了 01/30 09:10
ggian123 : 美國例外論信仰崩塌 01/30 09:10
sdbb : 推一味,願意好好選字的人越來越少 01/30 09:14
Leo4891 : 自己腦補就不用硬扯啥人家的意思了 01/30 09:14
fish813 : 要一直保持第一 很累 01/30 09:18
lusifa2007 : 沒吧 應該是更有效率的演算法加上更多的硬體 可以 01/30 09:22
lusifa2007 : 更快達到AGI的目標 01/30 09:22
xiemark : cudnn效率不是最佳 01/30 09:24
PaulPierce34: 有點像仿製藥的歷史,軟體應該更難封鎖技術複製 01/30 09:26
Jeff1989 : 單純腦補 笑死 01/30 09:27
mamorui : OpenAI不可能開源的,有pretrain data在手,沒必要 01/30 09:27
mamorui : 開源 01/30 09:27
nobody0522 : 在這裏幫DS洗地到底有什麼好處? 看不太懂網路與論 01/30 09:30
nobody0522 : 這波操作 01/30 09:30
sdbb : 仿製藥的問題,1.合成2.要有受試者驗證 01/30 09:30
sdbb : 軟體的話,小魯就不確定會卡在哪邊y 01/30 09:31
Manslayer69 : 中吹就搞笑啊,不過拿錢辦事可以理解。 01/30 09:32
k1k1832002 : 會洗地嗎,不就一堆在嘲諷不能查64,造假,抄襲, 01/30 09:36
k1k1832002 : 討論的重點一直都在於更低的成本達到相同效能,這 01/30 09:36
k1k1832002 : 洗什麼地 01/30 09:36
straggler7 : 好處就是降價97% 01/30 09:36
judy13857 : https://i.imgur.com/cUq8tHw.jpeg 01/30 09:37
ookimoo : LLM是到不了AGI的 信徒早點洗洗睡 01/30 09:37
k1k1832002 : 訂閱要花兩百美元現在有低價版,低價版卻變成靶子X 01/30 09:37
k1k1832002 : D 01/30 09:37
judy13857 : 有錢拿吧,上面Lushen都已經開示了,也洗好幾天了 01/30 09:37
tctv2002 : 好處就是一般需求的人用DS就可以了 01/30 09:37
ookimoo : 目前的經濟環境 各國經濟自主 美國想用AGI征服世界 01/30 09:37
ookimoo : 也不容易 大概需要一次大蕭條的經濟重置 01/30 09:38
straggler7 : 華碩 宏碁 都可以自建AI雲了 打破壟斷 01/30 09:39
s213092921 : AI護城河還沒套利變現,就被DS挖了祖墳,看你氣不氣 01/30 09:43
ookimoo : 至於版上多蛙 在喊多 都沒意義 要知道民主共和黨 01/30 09:44
ookimoo : 後面站的都是猶太人 只是這次換選共和黨而已 01/30 09:45
ookimoo : 你們在這裡喊多 但是操盤的猶太人要收回資金了 01/30 09:45
ookimoo : 你們會贏嗎 呵呵 01/30 09:45
sunpedro0202: 好啦不然你推說要買啥啊 01/30 09:50
miguel1968 : 中國花錢買網軍的實力真的跟DS一樣稱霸世界 01/30 09:51
Samurai : 什麼叫一般需求夠用?現在AI已經夠了? 01/30 09:54
NetsFan : 好啦,意見不同先抹黑最實在 01/30 09:54
※ 編輯: icrose (223.89.14.114 中國), 01/30/2025 09:59:14
newwu : 腦補太多了吧 01/30 09:59
newwu : 後半段全部都是你自己在想 01/30 10:00
fedona : 電力股已經開始反彈 01/30 10:02
aewul : 採訪說要用法律保持科技領先..怪怪 01/30 10:08
moustique : AI不只本夢比,還遇到追兵 01/30 10:09
clecer : ai還能幹嘛,說來聽聽 01/30 10:17
ppdogininder: 別造謠 門外漢就別亂評論 01/30 11:28
linzero : AI應用應該還有很多領域還沒完善,還是有砸錢搞算力 01/30 12:03
linzero : 的需求吧,不過可能語言這部分會降低需求 01/30 12:04
linzero : 而且應用落實後,研發可能需求降低,但應用方面需求 01/30 12:04
linzero : 也可能會更多 01/30 12:05
phoenixtwo : 妳的結論就是硬ㄠ 01/30 18:43