Re: [討論] 其實Deepseek真的很厲害了

作者ash9911911 (勇者ああああ)

看板C_Chat

標題Re: [討論] 其實Deepseek真的很厲害了

時間Wed Jan 29 22:17:17 2025

OpenAI：已掌握DeepSeek盜用模型證據 https://www.cna.com.tw/news/aopl/202501290140.aspx （中央社倫敦29日綜合外電報導）中國新創公司「深度求索」（DeepSeek）引發的疑慮日增。OpenAI今天表示已掌握證據，顯示DeepSeek盜用其模型進行開發；業界也指DeepSeek 握有大量輝達H100高階晶片，形同直接挑戰美國出口管制規定。中國的DeepSeek因標榜低成本也能訓練出強大人工智慧（AI）模型，顛覆AI訓練不能沒有精密昂貴晶片的刻板印象，引發市場強烈震盪。不過，總部設在美國舊金山（San Francisco）的OpenAI公司向英國「金融時報」（ Financial Times）證實，已掌握疑似DeepSeek利用「蒸餾」（distillation）技術的證據。OpenAI是聊天機器人ChatGPT的開發商。蒸餾技術可讓開發者利用更大、更強的模型輸出成果，在較小模型獲得更出色的表現，並讓他們在特定任務上以更低廉的成本得到類似結果。儘管蒸餾是AI業界常見做法，但DeepSeek若利用蒸餾技術來打造自家模型，並與OpenAI競爭，將違反OpenAI服務條款，因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款，用戶不得「複製」任何 OpenAI的服務，或是「利用輸出結果，來開發與OpenAI競爭的模型」。彭博（Bloomberg News）28日引述知情人士說法報導，微軟（Microsoft）和OpenAI正在調查一群與DeepSeek有關聯的人是否以未經授權的方式，不當取得OpenAI技術輸出的資訊。報導指，微軟維安研究員2024年秋天觀察到有人利用OpenAI應用程式介面（API）輸出大筆數據，他們認為這些人可能與DeepSeek有關。美國總統川普政府的AI專家塞克斯（David Sacks）也在福斯新聞（Fox News）訪談中提及蒸餾技術，並稱有「大量證據」顯示DeepSeek是仰賴OpenAI模型輸出，以協助開發自家技術，但他也沒有進一步提出證據。另一方面，美國Scale AI執行長汪滔（Alexandr Wang）日前表示，DeepSeek應握有多達5 萬顆輝達（Nvidia）H100晶片，以開發現有模型。美國億萬富豪馬斯克（Elon Musk）也在社群平台X回應相關推文，並加上「顯而易見」的評論，似乎同意這項說法。由於H100晶片被禁止向中國出口，這形同直接挑戰美國出口管制政策。有分析直指， DeepSeek繞道囤積大量晶片以規避美國管制，因此其真實開發成本恐怕遠高於宣稱的558 萬美元（約新台幣1.83億元），未來也勢必將引發美方加強管制。（譯者：楊昭彥/核稿：施施）1140129 挖要出大事了嗎是不是有大場面可以看了 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.40.22.228 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1738160240.A.5F1.html

→ gcobc12632: 哈 OpenAI急了 01/29 22:19

→ nomorethings: 樓下說不給晶片是不是怕輸不起 01/29 22:20

推 efun77000: 「蒸餾」（distillation）跟複製盜用應該還需要證據 01/29 22:22

→ Kt51000: 中國偷技術也不是一次兩次了 01/29 22:22

→ efun77000: 看OpenAI最後抓到什麼東西吧? 01/29 22:23

推 Eric85768: 樓下說急了 01/29 22:24

→ dandes0227: 被盜用當然急啊^^ 01/29 22:25

推 fireleo: 我覺得等OpenAI調查能挖到什麼結果吧 01/29 22:26

→ dandes0227: 也只有中國人會這樣把偷來的東西說成是自己發明的 01/29 22:26

推 sasmwh561: 果然還是要用一堆nv 硬體才算的出來，老黃穩穩的 01/29 22:27

→ spfy: 我樂子人等消息這麼多人急著站隊嗎 01/29 22:27

→ spfy: 今天之前有些看法是實際運算量沒這麼低成本 01/29 22:28

推 joejoe2: 這只是要安撫股東因為退訂的太多 closeAI被看破手腳 01/29 22:28

→ ThreekRoger: 看不懂，反正還能用就先用 01/29 22:28

※ 編輯: ash9911911 (114.40.22.228 臺灣), 01/29/2025 22:30:40

推 a2156700: 美國版的deepseek要賣50%給美國企業 01/29 22:31

推 RoastCorn: 我最喜歡血流成河了.jpg 01/29 22:34

→ Fates: 笑死 openai就沒盜嗎w 01/29 22:36

推 hcastray: 我是覺得沒必要站隊 01/29 22:37

推 astinky: 當然站隊啊，看棒球也是先從決定要支持哪個棒球隊開始(X 01/29 22:40

→ hcastray: 剛好我看中職現在也沒啥在支持球隊了 01/29 22:40

→ hcastray: 從球隊迷轉成球員迷輕鬆自在 01/29 22:41

→ henry1234562: 這個只是安撫股東沒錯實際上沒屁用 01/29 22:44

→ h75311418: 抄來便宜用在大外宣 01/29 22:44

→ henry1234562: 因為 deepseek真正打擊到openai的是他們的論文 01/29 22:44

→ henry1234562: 跟他們已經開源可以對照論文的研究成果 01/29 22:44

→ henry1234562: deepseek本身已經是用完的東西擺著給你用而已 01/29 22:44

推 outlook2: deepseek = 開源版open ai ? 01/29 22:46

→ outlook2: 這殺傷力... 01/29 22:46

→ henry1234562: 不等於差很多 01/29 22:46

→ henry1234562: deepseek做的事情是用小的模型在特定的領域 01/29 22:47

→ henry1234562: 做到能跟openai的o1接近能力而已 01/29 22:47

→ henry1234562: 優點就是他模型小所以他訓練起來便宜算力需求低 01/29 22:47

→ henry1234562: 缺點就是他是特定領域用的超出領域一概不會 01/29 22:48

→ henry1234562: 可以說從理念上就跟chatgpt是完全不同方向的產物 01/29 22:48

→ henry1234562: 你要說他抄襲怕是一點基礎都沒有 01/29 22:48

推 outlook2: openai會被嫌太浪費資源? 開發太浪費錢? AI會跳水大 01/29 22:49

→ outlook2: 降價? 01/29 22:49

→ outlook2: 感謝樓樓上的分析 01/29 22:50

→ henry1234562: 結論來說大概會是這樣所以實際損失的都是openai 01/29 22:51

→ henry1234562: 對於其他普羅大眾跟其他AI開發者都是好事 01/29 22:52

→ henry1234562: 他們有附論文 deepseek其實只是他們的研究報告 01/29 22:53

推 RandyOrlando: 大概只有沒什麼常識的覺得openai還可以靠吉人這招 01/29 22:53

→ RandyOrlando: 挽回劣勢吧 01/29 22:53

→ henry1234562: 吉人最多只能讓openai回收一點錢沒有其他用 01/29 22:54

→ AirPenguin: OpenAI(青春版) 01/29 22:54

→ henry1234562: 因為這一刀傷害是永久性的事實被戳穿了 01/29 22:54

→ henry1234562: 實際上deepseek這個路線更符合商業用途 01/29 22:55

→ RandyOrlando: openai本來是放消息說他們2030之前想要花2000億美 01/29 22:55

→ RandyOrlando: 元開發ai 01/29 22:55

推 vsepr55: 做賊的喊抓賊== 01/29 22:55

推 qazw222: 不會被打死但要被大砍一刀 01/29 22:55

→ RandyOrlando: 這個意思就是告訴投資人你要投資我到這些金額 01/29 22:55

推 XFarter: 其實不太有「超出領域一概不會」這件事ㄅ非distilled 版 01/29 22:55

→ XFarter: 本的參數其實也不小了 01/29 22:56

→ astinky: 現在的爭議是宣稱的開發成本造假嗎？ 01/29 22:56

→ henry1234562: 嘛你可以說超出領域約等於沒特別訓練過 01/29 22:56

→ RandyOrlando: 現在ds出來基本代表這個投資計畫不會再有2000億美 01/29 22:56

→ RandyOrlando: 元的可能性了 01/29 22:56

→ henry1234562: 一概不會就誇飾這樣他就唬爛你而已 01/29 22:56

→ henry1234562: 畢竟本身還是那個聊天機器人沒訓練下就那樣 01/29 22:57

→ XFarter: 說是研究報告不如說是火力展示更為貼切ㄅ他們還是有在 A 01/29 22:57

→ XFarter: PI 上面做收費的 01/29 22:57

→ XFarter: 不過那個價格真的是甜了很多比起openAI 更像是在推全世 01/29 22:57

→ XFarter: 界的 AI 福祉== 01/29 22:57

推 lain2002: 急了 01/29 22:58

→ XFarter: 我的意思是「超出領域就不會」可以適用於所有 LLM，不是 01/29 22:58

→ XFarter: 只有 DS 才有這個特徵，抱歉沒說清楚 01/29 22:58

→ henry1234562: 以下是我聽我哥說的信不信自己判斷 01/29 22:59

→ henry1234562: 據說這家本職就不是做AI的他們是靠金融買賣賺錢的 01/29 23:00

→ henry1234562: 它們原本就是訓練買賣股票的AI 然後靠買賣股票賺錢 01/29 23:00

→ henry1234562: 然後這次他們買了太多為了訓練這AI的算力 01/29 23:00

→ henry1234562: 所以多出來的就丟給技術部做研究反正擺著也是浪費 01/29 23:01

推 kaj1983: openai也不會多傷吧，這行業仍然是大者恆大 01/29 23:01

→ henry1234562: 這個deepseek就是它們研究成果這樣 01/29 23:01

→ nomorethings: 全世界AI福祉？ 01/29 23:01

→ spfy: 是不是越來越奇怪了變成多買的算力順便研究?? 01/29 23:01

→ henry1234562: 所以那550萬美元本身就是他們多買的算力而已 01/29 23:01

→ henry1234562: 然後開源也是因為這就技術研究不是主產品隨便你用 01/29 23:02

→ spfy: 那個天才工程師和天才創辦人也是順便的? 01/29 23:02

推 fenix220: 畢竟是支 01/29 23:02

推 RandyOrlando: 本來就是福祉阿本來要宣稱要花幾千億美元才能推動 01/29 23:03

→ RandyOrlando: 現在有只花1%一下金額的能做到了能投入資金的門 01/29 23:03

→ RandyOrlando: 檻低那麼多就會有更多人來做 01/29 23:03

→ henry1234562: 噱頭吧反正炒一炒無傷大雅阿 01/29 23:03

→ henry1234562: 他們收的錢就只是算力不想給你免費用而已 01/29 23:03

→ henry1234562: 畢竟你直接用是用他們的算力阿收你基本費不過分吧 01/29 23:03

→ henry1234562: 你拿開源模型回去自己用他才不管你了 01/29 23:03

→ henry1234562: 你就說這是不是才是真正"OPENAI" 該有的樣子 01/29 23:04

→ henry1234562: 論文給了模型給了你想試用也給你用了還想怎樣 01/29 23:04

推 RandyOrlando: 對某些人來說可以便宜推動世界進步的技術不重要出 01/29 23:07

→ RandyOrlando: 產國家是哪個比較重要的概念 01/29 23:07

推 Richun: 原本OpenAI可以閉源只給人接API，就算meta丟出LLaMA也是遠 01/29 23:07

推 balabala56: 老黃大勝利 01/29 23:08

→ Richun: 不及OpenAI的效果，靠著接API穩定賺的錢忽然被deepseek開 01/29 23:08

推 Lhmstu: openai先說拿了哪些東西訓練，我們再來講“偷”這件事 01/29 23:09

→ Richun: 源砍了一大刀，原本宣稱需要的巨額投資被戳一下就洩氣了。 01/29 23:09

→ astinky: 當然是連算力都免費給人用啊，鄉民當然什麼都想要免費 01/29 23:09

→ Lhmstu: 偷網路上的東西訓練模型來賺錢，還閉源... 01/29 23:09

推 fenix220: 世界進步呵呵 01/29 23:11

推 dandes0227: 中國人的反駁怎麼都一樣啊人家問你有沒有打老婆你 01/29 23:12

→ dandes0227: 就反問對方沒打老婆嗎 01/29 23:12

推 sinnerck1: DS開源才是對openAI打擊最大的 01/29 23:12

→ fenix220: 證明真的小粉紅還是比數位小粉紅好用 01/29 23:12

推 RandyOrlando: 討論這種議題還想在那邊跳4-11吼也只能說就這樣了 01/29 23:13

→ RandyOrlando: 啦呵呵 01/29 23:13

→ henry1234562: 八卦有人講得更清楚點 deepseek重點是方法論不同 01/29 23:13

→ henry1234562: 所以實際上你拿任何模型都能用那方法論提升訓練校率 01/29 23:14

→ henry1234562: openAI之所以閉源是為了藏他們提升效能的指導方式 01/29 23:15

→ henry1234562: deepseek的路線就不需要指導方式了所以不同 01/29 23:15

→ terry955048: 黑市什麼都買得到，管制就是笑話 01/29 23:16

→ astinky: 但是ds提升的只有減低成本，要品質還是出不來的樣子？ 01/29 23:16

→ Lhmstu: 這樣就中國人了喔，可悲政治腦... 01/29 23:16

→ henry1234562: 品質就論文說的在特定領域確實能訓練到跟o1一樣強 01/29 23:18

→ henry1234562: 而且某方面來說前後文對照還更強一點 01/29 23:18

→ AirPenguin: 撿網路上資料訓練跟拿人家訓練好的資料是兩碼子事吧 01/29 23:18

→ henry1234562: 然後在AI領域降低成本不太是"只有" 的問題 01/29 23:18

→ henry1234562: 老實說我懶得對會相信deepseek拿訓練好資料的人解釋 01/29 23:20

→ henry1234562: 論文都在那了拿別人資料是有啥用處 01/29 23:20

→ AirPenguin: 沒人在跟你講話啦要回那麼大一串怎麼不乾脆回一篇 01/29 23:21

→ henry1234562: 沒欠你啊幹嘛要浪費我時間發一篇 01/29 23:22

→ Hakase5566: OpenAI都沒開源是要怎麼抄襲？ 01/29 23:22

→ Hakase5566: 台灣真神奇沒開源的東西一堆人相信有被偷然後公開 01/29 23:24

→ Hakase5566: 的論文被抄襲反而卻有不少人護航 01/29 23:24

推 fireleo: 老實說號稱低成本就能跟GPT一樣算力這個就有很大的疑問 01/29 23:24

→ fireleo: 了 01/29 23:24

推 neige923: 稀土一帶一路5G華為晶片...支那謊言破產速度愈來愈快， 01/29 23:25

→ henry1234562: 他論文有寫用什麼比跟什麼模型比評分個是多少 01/29 23:25

→ neige923: 現在才兩日就開始跑破解流程了 01/29 23:25

→ henry1234562: 所以不信可以自己去試試看 01/29 23:25

→ AirPenguin: 在這下面回了快一個小時時間還真寶貴啊 01/29 23:26

→ henry1234562: 回推文跟回文要的時間差距難道要我教你? 01/29 23:26

→ kaj1983: 你們在這吵好像也沒有辦法驗證誰對誰錯啊 01/29 23:26

推 cactus44: 都開源免費使用,真有抄襲證據應該很好抓吧,而且一 01/29 23:26

→ cactus44: 堆研究者查不出也難莫名的 01/29 23:26

→ henry1234562: 我個人認為至少效能這部分如果是假的早就被公開了 01/29 23:27

→ kaj1983: 真的有抄襲早就一刀斃命了 01/29 23:27

→ henry1234562: 這麼多人去試評分是假的應該不難測出來吧 01/29 23:28

→ henry1234562: 至於成本這只能說就你信不信囉方法論寫在論文 01/29 23:28

→ henry1234562: 等別人試論文的方法論能不能複現吧 01/29 23:29

→ astinky: 如果以陰謀論來猜想，假設復現需要相當的時間及成本，等 01/29 23:31

→ astinky: 證明為假之時是否有炒作股票套利的空間可能？ 01/29 23:31

→ AirPenguin: 想吵是建議去股版啦推文這串在股版都講到爛了 01/29 23:33

→ henry1234562: 我不能說沒有但我是覺得為了搞這套也太大手筆 01/29 23:34

→ astinky: 看新聞講市值蒸發多少多少，好像為此而大手筆也不為過？ 01/29 23:37

推 webberfun: 畢竟是支那 01/29 23:46

推 XFarter: 都幾乎全開源給你看了論文也有跟裸奔沒兩樣其實光這樣 01/29 23:47

→ XFarter: 質疑的聲音就小很多也是為什麼全世界整個炸開的原因== 01/29 23:47

→ XFarter: 一些相對沒根據的質疑是真的大可不必 01/29 23:47

→ XFarter: 效能要是假的也太難 livebench 這種第三方測試的都表示真 01/29 23:48

→ XFarter: 的強如鬼神了 01/29 23:48

→ xga00mex: 抄襲看笑話沒抄爽用開源模型都好 01/29 23:52

推 RandyOrlando: 主打的就是一個我不了解但是我硬要嘴的概念嘛習慣 01/29 23:52

→ RandyOrlando: 就好 01/29 23:52

推 qazzqaz: 抱歉好奇伸手問個， 01/29 23:58

→ qazzqaz: DeepSeek是開源到連model都能自己載來玩嗎？ 01/29 23:58

→ qazzqaz: 還是單純把他的方法寫成paper? 01/29 23:58

→ qazzqaz: 喔喔，找到GitHub頁面了，竟然有欸，沒事，你們繼續(x 01/30 00:00

推 ISAF: 謝謝中國膠的表演 01/30 00:02

→ henry1234562: 答案是都有XDD 01/30 00:10

推 aa9012: Deepseek免錢我站DS 01/30 00:14

推 tim860628: 我只關心什麼時候會有基於Deepaeek的瑟瑟模型 01/30 00:18

→ inte629l: 原來可以藉由API的output去微調其他模型? cool 01/30 00:21

推 qazzqaz: 挖乾，看了一下，他好幾個模型的license都沒有擋商用， 01/30 00:24

→ qazzqaz: 不確定是不是正常(我對open source規則不熟) 01/30 00:24

→ qazzqaz: 這樣子感覺未來的潛力很可怕耶，市場真的要亂掉了ww 01/30 00:24

推 ZeroArcher: AirPenguin看起來好急喔 01/30 00:25

→ qazzqaz: 希望不是像Mamba那樣曇花一現 01/30 00:25

→ spfy: 我也覺得蓋大樓不如回一篇這很正常 01/30 00:28

→ qazzqaz: 順帶一提，有看到不給軍事用途，但真的用了哪抓得到w 01/30 00:28

→ spfy: 喊很急不如多回點內容 01/30 00:28

推 qtsin: 都是到處爬了一堆沒授權，旁邊看戲就好 01/30 00:29

→ henry1234562: 都開源了就是給大家研究他們自己會不會研究不知道 01/30 00:29

→ henry1234562: 我不想回文兩個原因 1.費時沒欠你 2.我也不是專業 01/30 00:30

→ henry1234562: 基本上全是自己理解你自己去查不會差到哪去 01/30 00:31

→ henry1234562: 除了我哥說的那段公司拿剩餘算力來做的可能查不到外 01/30 00:31

→ henry1234562: 其他的怕是你自己查可能更正確 01/30 00:31

→ spfy: 我說我覺得他說的對不是要你回文你沒欠我沒錯 01/30 00:32

→ henry1234562: 所以我覺得整理我說的話沒意義這樣 01/30 00:33

推 qazzqaz: 但如果那個說法屬實，他開源出去反而會影響到本業吧 01/30 00:34

→ qazzqaz: 拿來弄股票的人一多，本來的模型就不準了 01/30 00:34

→ qazzqaz: 等於是拿石頭砸自己的腳，除非他覺得改靠賣API賺更多 01/30 00:35

推 Peurintesa: 有技術報告也有Github啊 openai告了頂多跟DS討錢 01/30 00:35

→ Peurintesa: 但東西都開源了技術散播出去也收不回來了 01/30 00:36

→ henry1234562: 可能性很多例如他的模型也有考慮過這個了 01/30 00:37

推 ilove640: 急了 01/30 00:37

推 Richun: 他開源出去又不會污染到原本的資料集，可以當成分叉就好。 01/30 00:37

→ henry1234562: 或是他們蠢沒想到這層或是我哥胡說我也跟著胡說 01/30 00:37

→ Richun: 因為不是本業，所以可以靠低價入市+開源打廣告。 01/30 00:38

推 vios10009: 這種東西開源就跟把辟邪劍譜印了10萬份 01/30 00:38

→ vios10009: 散播到整個江湖去一樣 01/30 00:38

→ henry1234562: 最有價值的確實就是論文沒錯 01/30 00:39

→ henry1234562: 開源就是論文附的示範品這樣 01/30 00:39

推 cactus44: 已經開始有企業導入DS來用了,免錢這點優勢真的很大 01/30 00:40

→ henry1234562: 至少個人認為這對AI發展是好事啦 01/30 00:43

推 Peurintesa: 還在著重套模的我覺得太小看DS了他是有說明怎麼做的 01/30 00:43

→ henry1234562: 不管是應用面還是開發面都會成長不少 01/30 00:43

推 inmatao: 遙想手雕晶片 01/30 00:59

噓 defreestijl: OpenAI自己都不敢公布訓練用到哪些source了 01/30 01:04

→ defreestijl: 只會說一切來源合法合規 01/30 01:04

推 shortoneal: 笑死，不能幹openAI輸出的結果訓練，阿你訓練GPT的 01/30 01:57

→ shortoneal: data哪來的，請一堆科學家幫你寫的逆 01/30 01:57

→ shortoneal: 這領域我是不知道誰有臉跳出來喊人侵權啦 01/30 01:58

→ shortoneal: 但是github是微軟主場，會不會出陰招強迫閉源呢? 01/30 02:00

→ qwer338859: GitHub只是一個倉庫被擋用別家不就好了 01/30 02:18

推 willy4907: 急了證明DS殺傷力很大 01/30 03:09

推 urzakim: 我有證據但是我不跟你說名嘴嗎？ 01/30 07:08

推 skullxism: 要有證據才能說人家打老婆吧，Excel打老婆嗎 01/30 07:12

推 blessbless: 這不就沒證據出來安撫股民的，真的告了再來談好嗎 01/30 08:09

推 DICKASDF: 我覺得這看下去就知道但台灣很奇怪的是 01/30 08:11

→ DICKASDF: 一堆人急著跳出來批評出發點是因為那是中國做的 01/30 08:11

→ kasim15: 股民請保持信心XDD 01/30 08:15

推 tcl1219: OpenAI還沒上市吧 01/30 08:19

→ jay920314: 人家開源高大上 01/30 08:50

推 Diver123: 我有證據但我不能公布，好怪 01/30 08:51

推 henshin: 逢中必反蟾蜍又來了 01/30 09:27

→ suanruei: 那你close ai 怎麼拿不出同樣的成果 01/30 09:56

推 fenix220: 逢支必舔人啟動 01/30 10:15

→ Ceferino: openai的推理模型又沒開源怎麼distillation，買訂閱一 01/30 10:46

→ Ceferino: 直瘋狂問嗎ww 01/30 10:46