→ gcobc12632: 哈 OpenAI急了 01/29 22:19
→ nomorethings: 樓下說不給晶片是不是怕輸不起 01/29 22:20
推 efun77000: 「蒸餾」(distillation) 跟複製盜用應該還需要證據 01/29 22:22
→ Kt51000: 中國偷技術也不是一次兩次了 01/29 22:22
→ efun77000: 看OpenAI最後抓到什麼東西吧? 01/29 22:23
推 Eric85768: 樓下說急了 01/29 22:24
→ dandes0227: 被盜用當然急啊^^ 01/29 22:25
推 fireleo: 我覺得等OpenAI調查能挖到什麼結果吧 01/29 22:26
→ dandes0227: 也只有中國人會這樣把偷來的東西說成是自己發明的 01/29 22:26
推 sasmwh561: 果然還是要用一堆nv 硬體才算的出來,老黃穩穩的 01/29 22:27
→ spfy: 我樂子人等消息 這麼多人急著站隊嗎 01/29 22:27
→ spfy: 今天之前 有些看法是實際運算量沒這麼低成本 01/29 22:28
推 joejoe2: 這只是要安撫股東 因為退訂的太多 closeAI被看破手腳 01/29 22:28
→ ThreekRoger: 看不懂,反正還能用就先用 01/29 22:28
※ 編輯: ash9911911 (114.40.22.228 臺灣), 01/29/2025 22:30:40
推 a2156700: 美國版的deepseek要賣50%給美國企業 01/29 22:31
推 RoastCorn: 我最喜歡血流成河了.jpg 01/29 22:34
→ Fates: 笑死 openai就沒盜嗎w 01/29 22:36
推 hcastray: 我是覺得沒必要站隊 01/29 22:37
推 astinky: 當然站隊啊,看棒球也是先從決定要支持哪個棒球隊開始(X 01/29 22:40
→ hcastray: 剛好我看中職現在也沒啥在支持球隊了 01/29 22:40
→ hcastray: 從球隊迷轉成球員迷輕鬆自在 01/29 22:41
→ henry1234562: 這個只是安撫股東沒錯 實際上沒屁用 01/29 22:44
→ h75311418: 抄來便宜用在大外宣 01/29 22:44
→ henry1234562: 因為 deepseek真正打擊到openai的是他們的論文 01/29 22:44
→ henry1234562: 跟他們已經開源可以對照論文的研究成果 01/29 22:44
→ henry1234562: deepseek本身已經是用完的東西 擺著給你用而已 01/29 22:44
推 outlook2: deepseek = 開源版open ai ? 01/29 22:46
→ outlook2: 這殺傷力... 01/29 22:46
→ henry1234562: 不等於 差很多 01/29 22:46
→ henry1234562: deepseek做的事情 是用小的模型 在特定的領域 01/29 22:47
→ henry1234562: 做到能跟openai的o1接近能力而已 01/29 22:47
→ henry1234562: 優點就是他模型小 所以他訓練起來便宜 算力需求低 01/29 22:47
→ henry1234562: 缺點就是 他是特定領域用的 超出領域一概不會 01/29 22:48
→ henry1234562: 可以說從理念上就跟chatgpt是完全不同方向的產物 01/29 22:48
→ henry1234562: 你要說他抄襲怕是一點基礎都沒有 01/29 22:48
推 outlook2: openai會被嫌太浪費資源? 開發太浪費錢? AI會跳水大 01/29 22:49
→ outlook2: 降價? 01/29 22:49
→ outlook2: 感謝樓樓上的分析 01/29 22:50
→ henry1234562: 結論來說 大概會是這樣 所以實際損失的都是openai 01/29 22:51
→ henry1234562: 對於其他普羅大眾 跟其他AI開發者 都是好事 01/29 22:52
→ henry1234562: 他們有附論文 deepseek其實只是他們的研究報告 01/29 22:53
推 RandyOrlando: 大概只有沒什麼常識的覺得openai還可以靠吉人這招 01/29 22:53
→ RandyOrlando: 挽回劣勢吧 01/29 22:53
→ henry1234562: 吉人最多只能讓openai回收一點錢 沒有其他用 01/29 22:54
→ AirPenguin: OpenAI(青春版) 01/29 22:54
→ henry1234562: 因為這一刀傷害是永久性的 事實被戳穿了 01/29 22:54
→ henry1234562: 實際上deepseek這個路線更符合商業用途 01/29 22:55
→ RandyOrlando: openai本來是放消息說他們2030之前想要花2000億美 01/29 22:55
→ RandyOrlando: 元開發ai 01/29 22:55
推 vsepr55: 做賊的喊抓賊== 01/29 22:55
推 qazw222: 不會被打死但要被大砍一刀 01/29 22:55
→ RandyOrlando: 這個意思就是告訴投資人你要投資我到這些金額 01/29 22:55
推 XFarter: 其實不太有「超出領域一概不會」這件事ㄅ 非distilled 版 01/29 22:55
→ XFarter: 本的參數其實也不小了 01/29 22:56
→ astinky: 現在的爭議是宣稱的開發成本造假嗎? 01/29 22:56
→ henry1234562: 嘛 你可以說 超出領域 約等於沒特別訓練過 01/29 22:56
→ RandyOrlando: 現在ds出來基本代表這個投資計畫不會再有2000億美 01/29 22:56
→ RandyOrlando: 元的可能性了 01/29 22:56
→ henry1234562: 一概不會就誇飾 這樣 他就唬爛你而已 01/29 22:56
→ henry1234562: 畢竟本身還是那個聊天機器人 沒訓練下就那樣 01/29 22:57
→ XFarter: 說是研究報告不如說是火力展示更為貼切ㄅ 他們還是有在 A 01/29 22:57
→ XFarter: PI 上面做收費的 01/29 22:57
→ XFarter: 不過那個價格真的是甜了很多 比起openAI 更像是在推全世 01/29 22:57
→ XFarter: 界的 AI 福祉== 01/29 22:57
推 lain2002: 急了 01/29 22:58
→ XFarter: 我的意思是「超出領域就不會」可以適用於所有 LLM,不是 01/29 22:58
→ XFarter: 只有 DS 才有這個特徵,抱歉沒說清楚 01/29 22:58
→ henry1234562: 以下是我聽我哥說的 信不信自己判斷 01/29 22:59
→ henry1234562: 據說這家本職就不是做AI的 他們是靠金融買賣賺錢的 01/29 23:00
→ henry1234562: 它們原本就是訓練買賣股票的AI 然後靠買賣股票賺錢 01/29 23:00
→ henry1234562: 然後這次他們買了太多為了訓練這AI的算力 01/29 23:00
→ henry1234562: 所以多出來的就丟給技術部做研究 反正擺著也是浪費 01/29 23:01
推 kaj1983: openai也不會多傷吧,這行業仍然是大者恆大 01/29 23:01
→ henry1234562: 這個deepseek就是它們研究成果 這樣 01/29 23:01
→ nomorethings: 全世界AI福祉 ? 01/29 23:01
→ spfy: 是不是越來越奇怪了 變成多買的算力順便研究?? 01/29 23:01
→ henry1234562: 所以那550萬美元本身就是他們多買的算力而已 01/29 23:01
→ henry1234562: 然後開源也是因為這就技術研究 不是主產品 隨便你用 01/29 23:02
→ spfy: 那個天才工程師和天才創辦人也是順便的? 01/29 23:02
推 fenix220: 畢竟是支 01/29 23:02
推 RandyOrlando: 本來就是福祉阿 本來要宣稱要花幾千億美元才能推動 01/29 23:03
→ RandyOrlando: 現在有只花1%一下金額的能做到了 能投入資金的門 01/29 23:03
→ RandyOrlando: 檻低那麼多就會有更多人來做 01/29 23:03
→ henry1234562: 噱頭吧 反正炒一炒無傷大雅阿 01/29 23:03
→ henry1234562: 他們收的錢就只是算力不想給你免費用而已 01/29 23:03
→ henry1234562: 畢竟你直接用是用他們的算力阿 收你基本費不過分吧 01/29 23:03
→ henry1234562: 你拿開源模型回去自己用他才不管你了 01/29 23:03
→ henry1234562: 你就說 這是不是才是真正"OPENAI" 該有的樣子 01/29 23:04
→ henry1234562: 論文給了 模型給了 你想試用也給你用了 還想怎樣 01/29 23:04
推 RandyOrlando: 對某些人來說可以便宜推動世界進步的技術不重要 出 01/29 23:07
→ RandyOrlando: 產國家是哪個比較重要的概念 01/29 23:07
推 Richun: 原本OpenAI可以閉源只給人接API,就算meta丟出LLaMA也是遠 01/29 23:07
推 balabala56: 老黃大勝利 01/29 23:08
→ Richun: 不及OpenAI的效果,靠著接API穩定賺的錢忽然被deepseek開 01/29 23:08
推 Lhmstu: openai先說拿了哪些東西訓練,我們再來講“偷”這件事 01/29 23:09
→ Richun: 源砍了一大刀,原本宣稱需要的巨額投資被戳一下就洩氣了。 01/29 23:09
→ astinky: 當然是連算力都免費給人用啊,鄉民當然什麼都想要免費 01/29 23:09
→ Lhmstu: 偷網路上的東西訓練模型來賺錢,還閉源... 01/29 23:09
推 fenix220: 世界進步呵呵 01/29 23:11
推 dandes0227: 中國人的反駁怎麼都一樣啊 人家問你有沒有打老婆 你 01/29 23:12
→ dandes0227: 就反問對方沒打老婆嗎 01/29 23:12
推 sinnerck1: DS開源才是對openAI打擊最大的 01/29 23:12
→ fenix220: 證明真的小粉紅還是比數位小粉紅好用 01/29 23:12
推 RandyOrlando: 討論這種議題還想在那邊跳4-11吼也只能說就這樣了 01/29 23:13
→ RandyOrlando: 啦 呵呵 01/29 23:13
→ henry1234562: 八卦有人講得更清楚點 deepseek重點是方法論不同 01/29 23:13
→ henry1234562: 所以實際上你拿任何模型都能用那方法論提升訓練校率 01/29 23:14
→ henry1234562: openAI之所以閉源 是為了藏他們提升效能的指導方式 01/29 23:15
→ henry1234562: deepseek的路線就不需要指導方式了 所以不同 01/29 23:15
→ terry955048: 黑市什麼都買得到,管制就是笑話 01/29 23:16
→ astinky: 但是ds提升的只有減低成本,要品質還是出不來的樣子? 01/29 23:16
→ Lhmstu: 這樣就中國人了喔,可悲政治腦... 01/29 23:16
→ henry1234562: 品質就論文說的 在特定領域確實能訓練到跟o1一樣強 01/29 23:18
→ henry1234562: 而且某方面來說前後文對照還更強一點 01/29 23:18
→ AirPenguin: 撿網路上資料訓練跟拿人家訓練好的資料是兩碼子事吧 01/29 23:18
→ henry1234562: 然後 在AI領域 降低成本不太是"只有" 的問題 01/29 23:18
→ henry1234562: 老實說我懶得對會相信deepseek拿訓練好資料的人解釋 01/29 23:20
→ henry1234562: 論文都在那了 拿別人資料是有啥用處 01/29 23:20
→ AirPenguin: 沒人在跟你講話啦 要回那麼大一串怎麼不乾脆回一篇 01/29 23:21
→ henry1234562: 沒欠你啊 幹嘛要浪費我時間發一篇 01/29 23:22
→ Hakase5566: OpenAI都沒開源是要怎麼抄襲? 01/29 23:22
→ Hakase5566: 台灣真神奇 沒開源的東西一堆人相信有被偷 然後公開 01/29 23:24
→ Hakase5566: 的論文被抄襲反而卻有不少人護航 01/29 23:24
推 fireleo: 老實說號稱低成本就能跟GPT一樣算力這個就有很大的疑問 01/29 23:24
→ fireleo: 了 01/29 23:24
推 neige923: 稀土一帶一路5G華為晶片...支那謊言破產速度愈來愈快, 01/29 23:25
→ henry1234562: 他論文有寫用什麼比 跟什麼模型比 評分個是多少 01/29 23:25
→ neige923: 現在才兩日就開始跑破解流程了 01/29 23:25
→ henry1234562: 所以不信可以自己去試試看 01/29 23:25
→ AirPenguin: 在這下面回了快一個小時 時間還真寶貴啊 01/29 23:26
→ henry1234562: 回推文跟回文要的時間差距難道要我教你? 01/29 23:26
→ kaj1983: 你們在這吵好像也沒有辦法驗證誰對誰錯啊 01/29 23:26
推 cactus44: 都開源免費使用,真有抄襲證據應該很好抓吧,而且一 01/29 23:26
→ cactus44: 堆研究者查不出也難莫名的 01/29 23:26
→ henry1234562: 我個人認為 至少效能這部分如果是假的早就被公開了 01/29 23:27
→ kaj1983: 真的有抄襲早就一刀斃命了 01/29 23:27
→ henry1234562: 這麼多人去試 評分是假的應該不難測出來吧 01/29 23:28
→ henry1234562: 至於成本 這只能說就你信不信囉 方法論寫在論文 01/29 23:28
→ henry1234562: 等別人試論文的方法論能不能複現吧 01/29 23:29
→ astinky: 如果以陰謀論來猜想,假設復現需要相當的時間及成本,等 01/29 23:31
→ astinky: 證明為假之時是否有炒作股票套利的空間可能? 01/29 23:31
→ AirPenguin: 想吵是建議去股版啦 推文這串在股版都講到爛了 01/29 23:33
→ henry1234562: 我不能說沒有 但我是覺得為了搞這套也太大手筆 01/29 23:34
→ astinky: 看新聞講市值蒸發多少多少,好像為此而大手筆也不為過? 01/29 23:37
推 webberfun: 畢竟是支那 01/29 23:46
推 XFarter: 都幾乎全開源給你看了 論文也有 跟裸奔沒兩樣 其實光這樣 01/29 23:47
→ XFarter: 質疑的聲音就小很多 也是為什麼全世界整個炸開的原因== 01/29 23:47
→ XFarter: 一些相對沒根據的質疑是真的大可不必 01/29 23:47
→ XFarter: 效能要是假的也太難 livebench 這種第三方測試的都表示真 01/29 23:48
→ XFarter: 的強如鬼神了 01/29 23:48
→ xga00mex: 抄襲看笑話 沒抄爽用開源模型 都好 01/29 23:52
推 RandyOrlando: 主打的就是一個我不了解但是我硬要嘴的概念嘛 習慣 01/29 23:52
→ RandyOrlando: 就好 01/29 23:52
推 qazzqaz: 抱歉好奇伸手問個, 01/29 23:58
→ qazzqaz: DeepSeek是開源到連model都能自己載來玩嗎? 01/29 23:58
→ qazzqaz: 還是單純把他的方法寫成paper? 01/29 23:58
→ qazzqaz: 喔喔,找到GitHub頁面了,竟然有欸,沒事,你們繼續(x 01/30 00:00
推 ISAF: 謝謝中國膠的表演 01/30 00:02
→ henry1234562: 答案是 都有XDD 01/30 00:10
推 aa9012: Deepseek免錢 我站DS 01/30 00:14
推 tim860628: 我只關心什麼時候會有基於Deepaeek的瑟瑟模型 01/30 00:18
→ inte629l: 原來可以藉由API的output去微調其他模型? cool 01/30 00:21
推 qazzqaz: 挖乾,看了一下,他好幾個模型的license都沒有擋商用, 01/30 00:24
→ qazzqaz: 不確定是不是正常(我對open source規則不熟) 01/30 00:24
→ qazzqaz: 這樣子感覺未來的潛力很可怕耶,市場真的要亂掉了ww 01/30 00:24
推 ZeroArcher: AirPenguin看起來好急喔 01/30 00:25
→ qazzqaz: 希望不是像Mamba那樣曇花一現 01/30 00:25
→ spfy: 我也覺得蓋大樓不如回一篇 這很正常 01/30 00:28
→ qazzqaz: 順帶一提,有看到不給軍事用途,但真的用了哪抓得到w 01/30 00:28
→ spfy: 喊很急不如多回點內容 01/30 00:28
推 qtsin: 都是到處爬了一堆沒授權,旁邊看戲就好 01/30 00:29
→ henry1234562: 都開源了 就是給大家研究 他們自己會不會研究不知道 01/30 00:29
→ henry1234562: 我不想回文兩個原因 1.費時 沒欠你 2.我也不是專業 01/30 00:30
→ henry1234562: 基本上全是自己理解 你自己去查不會差到哪去 01/30 00:31
→ henry1234562: 除了我哥說的那段公司拿剩餘算力來做的可能查不到外 01/30 00:31
→ henry1234562: 其他的怕是你自己查可能更正確 01/30 00:31
→ spfy: 我說我覺得他說的對 不是要你回文 你沒欠我沒錯 01/30 00:32
→ henry1234562: 所以我覺得整理我說的話沒意義 這樣 01/30 00:33
推 qazzqaz: 但如果那個說法屬實,他開源出去反而會影響到本業吧 01/30 00:34
→ qazzqaz: 拿來弄股票的人一多,本來的模型就不準了 01/30 00:34
→ qazzqaz: 等於是拿石頭砸自己的腳,除非他覺得改靠賣API賺更多 01/30 00:35
推 Peurintesa: 有技術報告也有Github啊 openai告了頂多跟DS討錢 01/30 00:35
→ Peurintesa: 但東西都開源了 技術散播出去也收不回來了 01/30 00:36
→ henry1234562: 可能性很多 例如他的模型也有考慮過這個了 01/30 00:37
推 ilove640: 急了 01/30 00:37
推 Richun: 他開源出去又不會污染到原本的資料集,可以當成分叉就好。 01/30 00:37
→ henry1234562: 或是他們蠢沒想到這層 或是 我哥胡說我也跟著胡說 01/30 00:37
→ Richun: 因為不是本業,所以可以靠低價入市+開源打廣告。 01/30 00:38
推 vios10009: 這種東西開源就跟把辟邪劍譜印了10萬份 01/30 00:38
→ vios10009: 散播到整個江湖去一樣 01/30 00:38
→ henry1234562: 最有價值的確實就是論文沒錯 01/30 00:39
→ henry1234562: 開源就是論文附的示範品這樣 01/30 00:39
推 cactus44: 已經開始有企業導入DS來用了,免錢這點優勢真的很大 01/30 00:40
→ henry1234562: 至少個人認為這對AI發展是好事啦 01/30 00:43
推 Peurintesa: 還在著重套模的我覺得太小看DS了 他是有說明怎麼做的 01/30 00:43
→ henry1234562: 不管是應用面還是開發面 都會成長不少 01/30 00:43
推 inmatao: 遙想手雕晶片 01/30 00:59
噓 defreestijl: OpenAI自己都不敢公布訓練用到哪些source了 01/30 01:04
→ defreestijl: 只會說一切來源合法合規 01/30 01:04
推 shortoneal: 笑死,不能幹openAI輸出的結果訓練,阿你訓練GPT的 01/30 01:57
→ shortoneal: data哪來的,請一堆科學家幫你寫的逆 01/30 01:57
→ shortoneal: 這領域我是不知道誰有臉跳出來喊人侵權啦 01/30 01:58
→ shortoneal: 但是github是微軟主場,會不會出陰招強迫閉源呢? 01/30 02:00
→ qwer338859: GitHub只是一個倉庫 被擋用別家不就好了 01/30 02:18
推 willy4907: 急了 證明DS殺傷力很大 01/30 03:09
推 urzakim: 我有證據 但是我不跟你說 名嘴嗎? 01/30 07:08
推 skullxism: 要有證據才能說人家打老婆吧,Excel打老婆嗎 01/30 07:12
推 blessbless: 這不就沒證據出來安撫股民的,真的告了再來談好嗎 01/30 08:09
推 DICKASDF: 我覺得這看下去就知道 但台灣很奇怪的是 01/30 08:11
→ DICKASDF: 一堆人急著跳出來批評 出發點是因為那是中國做的 01/30 08:11
→ kasim15: 股民請保持信心XDD 01/30 08:15
推 tcl1219: OpenAI還沒上市吧 01/30 08:19
→ jay920314: 人家開源 高大上 01/30 08:50
推 Diver123: 我有證據但我不能公布,好怪 01/30 08:51
推 henshin: 逢中必反蟾蜍又來了 01/30 09:27
→ suanruei: 那你close ai 怎麼拿不出同樣的成果 01/30 09:56
推 fenix220: 逢支必舔人 啟動 01/30 10:15
→ Ceferino: openai的推理模型又沒開源怎麼distillation,買訂閱一 01/30 10:46
→ Ceferino: 直瘋狂問嗎ww 01/30 10:46