看板 C_Chat 關於我們 聯絡資訊
OpenAI:已掌握DeepSeek盜用模型證據 https://www.cna.com.tw/news/aopl/202501290140.aspx (中央社倫敦29日綜合外電報導)中國新創公司「深度求索」(DeepSeek)引發的疑慮日 增。OpenAI今天表示已掌握證據,顯示DeepSeek盜用其模型進行開發;業界也指DeepSeek 握有大量輝達H100高階晶片,形同直接挑戰美國出口管制規定。 中國的DeepSeek因標榜低成本也能訓練出強大人工智慧(AI)模型,顛覆AI訓練不能沒有 精密昂貴晶片的刻板印象,引發市場強烈震盪。 不過,總部設在美國舊金山(San Francisco)的OpenAI公司向英國「金融時報」( Financial Times)證實,已掌握疑似DeepSeek利用「蒸餾」(distillation)技術的證 據。OpenAI是聊天機器人ChatGPT的開發商。 蒸餾技術可讓開發者利用更大、更強的模型輸出成果,在較小模型獲得更出色的表現,並 讓他們在特定任務上以更低廉的成本得到類似結果。 儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI競 爭,將違反OpenAI服務條款,因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何 OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。 彭博(Bloomberg News)28日引述知情人士說法報導,微軟(Microsoft)和OpenAI正在 調查一群與DeepSeek有關聯的人是否以未經授權的方式,不當取得OpenAI技術輸出的資訊 。 報導指,微軟維安研究員2024年秋天觀察到有人利用OpenAI應用程式介面(API)輸出大 筆數據,他們認為這些人可能與DeepSeek有關。 美國總統川普政府的AI專家塞克斯(David Sacks)也在福斯新聞(Fox News)訪談中提 及蒸餾技術,並稱有「大量證據」顯示DeepSeek是仰賴OpenAI模型輸出,以協助開發自家 技術,但他也沒有進一步提出證據。 另一方面,美國Scale AI執行長汪滔(Alexandr Wang)日前表示,DeepSeek應握有多達5 萬顆輝達(Nvidia)H100晶片,以開發現有模型。美國億萬富豪馬斯克(Elon Musk)也 在社群平台X回應相關推文,並加上「顯而易見」的評論,似乎同意這項說法。 由於H100晶片被禁止向中國出口,這形同直接挑戰美國出口管制政策。有分析直指, DeepSeek繞道囤積大量晶片以規避美國管制,因此其真實開發成本恐怕遠高於宣稱的558 萬美元(約新台幣1.83億元),未來也勢必將引發美方加強管制。 (譯者:楊昭彥/核稿:施施)1140129 挖要出大事了嗎 是不是有大場面可以看了 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.40.22.228 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1738160240.A.5F1.html
gcobc12632: 哈 OpenAI急了 01/29 22:19
nomorethings: 樓下說不給晶片是不是怕輸不起 01/29 22:20
efun77000: 「蒸餾」(distillation) 跟複製盜用應該還需要證據 01/29 22:22
Kt51000: 中國偷技術也不是一次兩次了 01/29 22:22
efun77000: 看OpenAI最後抓到什麼東西吧? 01/29 22:23
Eric85768: 樓下說急了 01/29 22:24
dandes0227: 被盜用當然急啊^^ 01/29 22:25
fireleo: 我覺得等OpenAI調查能挖到什麼結果吧 01/29 22:26
dandes0227: 也只有中國人會這樣把偷來的東西說成是自己發明的 01/29 22:26
sasmwh561: 果然還是要用一堆nv 硬體才算的出來,老黃穩穩的 01/29 22:27
spfy: 我樂子人等消息 這麼多人急著站隊嗎 01/29 22:27
spfy: 今天之前 有些看法是實際運算量沒這麼低成本 01/29 22:28
joejoe2: 這只是要安撫股東 因為退訂的太多 closeAI被看破手腳 01/29 22:28
ThreekRoger: 看不懂,反正還能用就先用 01/29 22:28
※ 編輯: ash9911911 (114.40.22.228 臺灣), 01/29/2025 22:30:40
a2156700: 美國版的deepseek要賣50%給美國企業 01/29 22:31
RoastCorn: 我最喜歡血流成河了.jpg 01/29 22:34
Fates: 笑死 openai就沒盜嗎w 01/29 22:36
hcastray: 我是覺得沒必要站隊 01/29 22:37
astinky: 當然站隊啊,看棒球也是先從決定要支持哪個棒球隊開始(X 01/29 22:40
hcastray: 剛好我看中職現在也沒啥在支持球隊了 01/29 22:40
hcastray: 從球隊迷轉成球員迷輕鬆自在 01/29 22:41
henry1234562: 這個只是安撫股東沒錯 實際上沒屁用 01/29 22:44
h75311418: 抄來便宜用在大外宣 01/29 22:44
henry1234562: 因為 deepseek真正打擊到openai的是他們的論文 01/29 22:44
henry1234562: 跟他們已經開源可以對照論文的研究成果 01/29 22:44
henry1234562: deepseek本身已經是用完的東西 擺著給你用而已 01/29 22:44
outlook2: deepseek = 開源版open ai ? 01/29 22:46
outlook2: 這殺傷力... 01/29 22:46
henry1234562: 不等於 差很多 01/29 22:46
henry1234562: deepseek做的事情 是用小的模型 在特定的領域 01/29 22:47
henry1234562: 做到能跟openai的o1接近能力而已 01/29 22:47
henry1234562: 優點就是他模型小 所以他訓練起來便宜 算力需求低 01/29 22:47
henry1234562: 缺點就是 他是特定領域用的 超出領域一概不會 01/29 22:48
henry1234562: 可以說從理念上就跟chatgpt是完全不同方向的產物 01/29 22:48
henry1234562: 你要說他抄襲怕是一點基礎都沒有 01/29 22:48
outlook2: openai會被嫌太浪費資源? 開發太浪費錢? AI會跳水大 01/29 22:49
outlook2: 降價? 01/29 22:49
outlook2: 感謝樓樓上的分析 01/29 22:50
henry1234562: 結論來說 大概會是這樣 所以實際損失的都是openai 01/29 22:51
henry1234562: 對於其他普羅大眾 跟其他AI開發者 都是好事 01/29 22:52
henry1234562: 他們有附論文 deepseek其實只是他們的研究報告 01/29 22:53
RandyOrlando: 大概只有沒什麼常識的覺得openai還可以靠吉人這招 01/29 22:53
RandyOrlando: 挽回劣勢吧 01/29 22:53
henry1234562: 吉人最多只能讓openai回收一點錢 沒有其他用 01/29 22:54
AirPenguin: OpenAI(青春版) 01/29 22:54
henry1234562: 因為這一刀傷害是永久性的 事實被戳穿了 01/29 22:54
henry1234562: 實際上deepseek這個路線更符合商業用途 01/29 22:55
RandyOrlando: openai本來是放消息說他們2030之前想要花2000億美 01/29 22:55
RandyOrlando: 元開發ai 01/29 22:55
vsepr55: 做賊的喊抓賊== 01/29 22:55
qazw222: 不會被打死但要被大砍一刀 01/29 22:55
RandyOrlando: 這個意思就是告訴投資人你要投資我到這些金額 01/29 22:55
XFarter: 其實不太有「超出領域一概不會」這件事ㄅ 非distilled 版 01/29 22:55
XFarter: 本的參數其實也不小了 01/29 22:56
astinky: 現在的爭議是宣稱的開發成本造假嗎? 01/29 22:56
henry1234562: 嘛 你可以說 超出領域 約等於沒特別訓練過 01/29 22:56
RandyOrlando: 現在ds出來基本代表這個投資計畫不會再有2000億美 01/29 22:56
RandyOrlando: 元的可能性了 01/29 22:56
henry1234562: 一概不會就誇飾 這樣 他就唬爛你而已 01/29 22:56
henry1234562: 畢竟本身還是那個聊天機器人 沒訓練下就那樣 01/29 22:57
XFarter: 說是研究報告不如說是火力展示更為貼切ㄅ 他們還是有在 A 01/29 22:57
XFarter: PI 上面做收費的 01/29 22:57
XFarter: 不過那個價格真的是甜了很多 比起openAI 更像是在推全世 01/29 22:57
XFarter: 界的 AI 福祉== 01/29 22:57
lain2002: 急了 01/29 22:58
XFarter: 我的意思是「超出領域就不會」可以適用於所有 LLM,不是 01/29 22:58
XFarter: 只有 DS 才有這個特徵,抱歉沒說清楚 01/29 22:58
henry1234562: 以下是我聽我哥說的 信不信自己判斷 01/29 22:59
henry1234562: 據說這家本職就不是做AI的 他們是靠金融買賣賺錢的 01/29 23:00
henry1234562: 它們原本就是訓練買賣股票的AI 然後靠買賣股票賺錢 01/29 23:00
henry1234562: 然後這次他們買了太多為了訓練這AI的算力 01/29 23:00
henry1234562: 所以多出來的就丟給技術部做研究 反正擺著也是浪費 01/29 23:01
kaj1983: openai也不會多傷吧,這行業仍然是大者恆大 01/29 23:01
henry1234562: 這個deepseek就是它們研究成果 這樣 01/29 23:01
nomorethings: 全世界AI福祉 ? 01/29 23:01
spfy: 是不是越來越奇怪了 變成多買的算力順便研究?? 01/29 23:01
henry1234562: 所以那550萬美元本身就是他們多買的算力而已 01/29 23:01
henry1234562: 然後開源也是因為這就技術研究 不是主產品 隨便你用 01/29 23:02
spfy: 那個天才工程師和天才創辦人也是順便的? 01/29 23:02
fenix220: 畢竟是支 01/29 23:02
RandyOrlando: 本來就是福祉阿 本來要宣稱要花幾千億美元才能推動 01/29 23:03
RandyOrlando: 現在有只花1%一下金額的能做到了 能投入資金的門 01/29 23:03
RandyOrlando: 檻低那麼多就會有更多人來做 01/29 23:03
henry1234562: 噱頭吧 反正炒一炒無傷大雅阿 01/29 23:03
henry1234562: 他們收的錢就只是算力不想給你免費用而已 01/29 23:03
henry1234562: 畢竟你直接用是用他們的算力阿 收你基本費不過分吧 01/29 23:03
henry1234562: 你拿開源模型回去自己用他才不管你了 01/29 23:03
henry1234562: 你就說 這是不是才是真正"OPENAI" 該有的樣子 01/29 23:04
henry1234562: 論文給了 模型給了 你想試用也給你用了 還想怎樣 01/29 23:04
RandyOrlando: 對某些人來說可以便宜推動世界進步的技術不重要 出 01/29 23:07
RandyOrlando: 產國家是哪個比較重要的概念 01/29 23:07
Richun: 原本OpenAI可以閉源只給人接API,就算meta丟出LLaMA也是遠 01/29 23:07
balabala56: 老黃大勝利 01/29 23:08
Richun: 不及OpenAI的效果,靠著接API穩定賺的錢忽然被deepseek開 01/29 23:08
Lhmstu: openai先說拿了哪些東西訓練,我們再來講“偷”這件事 01/29 23:09
Richun: 源砍了一大刀,原本宣稱需要的巨額投資被戳一下就洩氣了。 01/29 23:09
astinky: 當然是連算力都免費給人用啊,鄉民當然什麼都想要免費 01/29 23:09
Lhmstu: 偷網路上的東西訓練模型來賺錢,還閉源... 01/29 23:09
fenix220: 世界進步呵呵 01/29 23:11
dandes0227: 中國人的反駁怎麼都一樣啊 人家問你有沒有打老婆 你 01/29 23:12
dandes0227: 就反問對方沒打老婆嗎 01/29 23:12
sinnerck1: DS開源才是對openAI打擊最大的 01/29 23:12
fenix220: 證明真的小粉紅還是比數位小粉紅好用 01/29 23:12
RandyOrlando: 討論這種議題還想在那邊跳4-11吼也只能說就這樣了 01/29 23:13
RandyOrlando: 啦 呵呵 01/29 23:13
henry1234562: 八卦有人講得更清楚點 deepseek重點是方法論不同 01/29 23:13
henry1234562: 所以實際上你拿任何模型都能用那方法論提升訓練校率 01/29 23:14
henry1234562: openAI之所以閉源 是為了藏他們提升效能的指導方式 01/29 23:15
henry1234562: deepseek的路線就不需要指導方式了 所以不同 01/29 23:15
terry955048: 黑市什麼都買得到,管制就是笑話 01/29 23:16
astinky: 但是ds提升的只有減低成本,要品質還是出不來的樣子? 01/29 23:16
Lhmstu: 這樣就中國人了喔,可悲政治腦... 01/29 23:16
henry1234562: 品質就論文說的 在特定領域確實能訓練到跟o1一樣強 01/29 23:18
henry1234562: 而且某方面來說前後文對照還更強一點 01/29 23:18
AirPenguin: 撿網路上資料訓練跟拿人家訓練好的資料是兩碼子事吧 01/29 23:18
henry1234562: 然後 在AI領域 降低成本不太是"只有" 的問題 01/29 23:18
henry1234562: 老實說我懶得對會相信deepseek拿訓練好資料的人解釋 01/29 23:20
henry1234562: 論文都在那了 拿別人資料是有啥用處 01/29 23:20
AirPenguin: 沒人在跟你講話啦 要回那麼大一串怎麼不乾脆回一篇 01/29 23:21
henry1234562: 沒欠你啊 幹嘛要浪費我時間發一篇 01/29 23:22
Hakase5566: OpenAI都沒開源是要怎麼抄襲? 01/29 23:22
Hakase5566: 台灣真神奇 沒開源的東西一堆人相信有被偷 然後公開 01/29 23:24
Hakase5566: 的論文被抄襲反而卻有不少人護航 01/29 23:24
fireleo: 老實說號稱低成本就能跟GPT一樣算力這個就有很大的疑問 01/29 23:24
fireleo: 了 01/29 23:24
neige923: 稀土一帶一路5G華為晶片...支那謊言破產速度愈來愈快, 01/29 23:25
henry1234562: 他論文有寫用什麼比 跟什麼模型比 評分個是多少 01/29 23:25
neige923: 現在才兩日就開始跑破解流程了 01/29 23:25
henry1234562: 所以不信可以自己去試試看 01/29 23:25
AirPenguin: 在這下面回了快一個小時 時間還真寶貴啊 01/29 23:26
henry1234562: 回推文跟回文要的時間差距難道要我教你? 01/29 23:26
kaj1983: 你們在這吵好像也沒有辦法驗證誰對誰錯啊 01/29 23:26
cactus44: 都開源免費使用,真有抄襲證據應該很好抓吧,而且一 01/29 23:26
cactus44: 堆研究者查不出也難莫名的 01/29 23:26
henry1234562: 我個人認為 至少效能這部分如果是假的早就被公開了 01/29 23:27
kaj1983: 真的有抄襲早就一刀斃命了 01/29 23:27
henry1234562: 這麼多人去試 評分是假的應該不難測出來吧 01/29 23:28
henry1234562: 至於成本 這只能說就你信不信囉 方法論寫在論文 01/29 23:28
henry1234562: 等別人試論文的方法論能不能複現吧 01/29 23:29
astinky: 如果以陰謀論來猜想,假設復現需要相當的時間及成本,等 01/29 23:31
astinky: 證明為假之時是否有炒作股票套利的空間可能? 01/29 23:31
AirPenguin: 想吵是建議去股版啦 推文這串在股版都講到爛了 01/29 23:33
henry1234562: 我不能說沒有 但我是覺得為了搞這套也太大手筆 01/29 23:34
astinky: 看新聞講市值蒸發多少多少,好像為此而大手筆也不為過? 01/29 23:37
webberfun: 畢竟是支那 01/29 23:46
XFarter: 都幾乎全開源給你看了 論文也有 跟裸奔沒兩樣 其實光這樣 01/29 23:47
XFarter: 質疑的聲音就小很多 也是為什麼全世界整個炸開的原因== 01/29 23:47
XFarter: 一些相對沒根據的質疑是真的大可不必 01/29 23:47
XFarter: 效能要是假的也太難 livebench 這種第三方測試的都表示真 01/29 23:48
XFarter: 的強如鬼神了 01/29 23:48
xga00mex: 抄襲看笑話 沒抄爽用開源模型 都好 01/29 23:52
RandyOrlando: 主打的就是一個我不了解但是我硬要嘴的概念嘛 習慣 01/29 23:52
RandyOrlando: 就好 01/29 23:52
qazzqaz: 抱歉好奇伸手問個, 01/29 23:58
qazzqaz: DeepSeek是開源到連model都能自己載來玩嗎? 01/29 23:58
qazzqaz: 還是單純把他的方法寫成paper? 01/29 23:58
qazzqaz: 喔喔,找到GitHub頁面了,竟然有欸,沒事,你們繼續(x 01/30 00:00
ISAF: 謝謝中國膠的表演 01/30 00:02
henry1234562: 答案是 都有XDD 01/30 00:10
aa9012: Deepseek免錢 我站DS 01/30 00:14
tim860628: 我只關心什麼時候會有基於Deepaeek的瑟瑟模型 01/30 00:18
inte629l: 原來可以藉由API的output去微調其他模型? cool 01/30 00:21
qazzqaz: 挖乾,看了一下,他好幾個模型的license都沒有擋商用, 01/30 00:24
qazzqaz: 不確定是不是正常(我對open source規則不熟) 01/30 00:24
qazzqaz: 這樣子感覺未來的潛力很可怕耶,市場真的要亂掉了ww 01/30 00:24
ZeroArcher: AirPenguin看起來好急喔 01/30 00:25
qazzqaz: 希望不是像Mamba那樣曇花一現 01/30 00:25
spfy: 我也覺得蓋大樓不如回一篇 這很正常 01/30 00:28
qazzqaz: 順帶一提,有看到不給軍事用途,但真的用了哪抓得到w 01/30 00:28
spfy: 喊很急不如多回點內容 01/30 00:28
qtsin: 都是到處爬了一堆沒授權,旁邊看戲就好 01/30 00:29
henry1234562: 都開源了 就是給大家研究 他們自己會不會研究不知道 01/30 00:29
henry1234562: 我不想回文兩個原因 1.費時 沒欠你 2.我也不是專業 01/30 00:30
henry1234562: 基本上全是自己理解 你自己去查不會差到哪去 01/30 00:31
henry1234562: 除了我哥說的那段公司拿剩餘算力來做的可能查不到外 01/30 00:31
henry1234562: 其他的怕是你自己查可能更正確 01/30 00:31
spfy: 我說我覺得他說的對 不是要你回文 你沒欠我沒錯 01/30 00:32
henry1234562: 所以我覺得整理我說的話沒意義 這樣 01/30 00:33
qazzqaz: 但如果那個說法屬實,他開源出去反而會影響到本業吧 01/30 00:34
qazzqaz: 拿來弄股票的人一多,本來的模型就不準了 01/30 00:34
qazzqaz: 等於是拿石頭砸自己的腳,除非他覺得改靠賣API賺更多 01/30 00:35
Peurintesa: 有技術報告也有Github啊 openai告了頂多跟DS討錢 01/30 00:35
Peurintesa: 但東西都開源了 技術散播出去也收不回來了 01/30 00:36
henry1234562: 可能性很多 例如他的模型也有考慮過這個了 01/30 00:37
ilove640: 急了 01/30 00:37
Richun: 他開源出去又不會污染到原本的資料集,可以當成分叉就好。 01/30 00:37
henry1234562: 或是他們蠢沒想到這層 或是 我哥胡說我也跟著胡說 01/30 00:37
Richun: 因為不是本業,所以可以靠低價入市+開源打廣告。 01/30 00:38
vios10009: 這種東西開源就跟把辟邪劍譜印了10萬份 01/30 00:38
vios10009: 散播到整個江湖去一樣 01/30 00:38
henry1234562: 最有價值的確實就是論文沒錯 01/30 00:39
henry1234562: 開源就是論文附的示範品這樣 01/30 00:39
cactus44: 已經開始有企業導入DS來用了,免錢這點優勢真的很大 01/30 00:40
henry1234562: 至少個人認為這對AI發展是好事啦 01/30 00:43
Peurintesa: 還在著重套模的我覺得太小看DS了 他是有說明怎麼做的 01/30 00:43
henry1234562: 不管是應用面還是開發面 都會成長不少 01/30 00:43
inmatao: 遙想手雕晶片 01/30 00:59
defreestijl: OpenAI自己都不敢公布訓練用到哪些source了 01/30 01:04
defreestijl: 只會說一切來源合法合規 01/30 01:04
shortoneal: 笑死,不能幹openAI輸出的結果訓練,阿你訓練GPT的 01/30 01:57
shortoneal: data哪來的,請一堆科學家幫你寫的逆 01/30 01:57
shortoneal: 這領域我是不知道誰有臉跳出來喊人侵權啦 01/30 01:58
shortoneal: 但是github是微軟主場,會不會出陰招強迫閉源呢? 01/30 02:00
qwer338859: GitHub只是一個倉庫 被擋用別家不就好了 01/30 02:18
willy4907: 急了 證明DS殺傷力很大 01/30 03:09
urzakim: 我有證據 但是我不跟你說 名嘴嗎? 01/30 07:08
skullxism: 要有證據才能說人家打老婆吧,Excel打老婆嗎 01/30 07:12
blessbless: 這不就沒證據出來安撫股民的,真的告了再來談好嗎 01/30 08:09
DICKASDF: 我覺得這看下去就知道 但台灣很奇怪的是 01/30 08:11
DICKASDF: 一堆人急著跳出來批評 出發點是因為那是中國做的 01/30 08:11
kasim15: 股民請保持信心XDD 01/30 08:15
tcl1219: OpenAI還沒上市吧 01/30 08:19
jay920314: 人家開源 高大上 01/30 08:50
Diver123: 我有證據但我不能公布,好怪 01/30 08:51
henshin: 逢中必反蟾蜍又來了 01/30 09:27
suanruei: 那你close ai 怎麼拿不出同樣的成果 01/30 09:56
fenix220: 逢支必舔人 啟動 01/30 10:15
Ceferino: openai的推理模型又沒開源怎麼distillation,買訂閱一 01/30 10:46
Ceferino: 直瘋狂問嗎ww 01/30 10:46