Re: [新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高

作者lucien0410 (lucein)

看板Stock

標題Re: [新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高

時間Mon Jan 27 12:25:51 2025

總覺得這個橫空出世的deepseek有點貓膩像LDPC大所說感覺好像真的用了openai 的ChatGpt的數據來創造訓練資料但openAI很難證明自己的東西被偷了我去看了一下deepseek的python api怎麼用很有趣結果deepseek用的是 openai的library https://api-docs.deepseek.com/ ``` # Please install OpenAI SDK first: `pip3 install openai` from openai import OpenAI client = OpenAI(api_key="<DeepSeek API Key>", base_url="https://api.deepseek.c om") response = client.chat.completions.create( model="deepseek-chat", messages=[ {"role": "system", "content": "You are a helpful assistant"}, {"role": "user", "content": "Hello"}, ], stream=False ) print(response.choices[0].message.content) ``` 難道OpenAI裡面出了個中國間諜? ※ 引述《LDPC (Channel Coding)》之銘言： : 目前就在旁邊吃瓜觀望@@ 成本這種本就是用開源後的可以拿已有的模型去當輔助下降成? : 最常見作法就是拿gpt-4o當judge或者當數據產生器去精煉數據集如果再沒有gpt-4o : 情況下很多高質量資料去產生就花很錢最經點例子就是LLaVa 一個博士班學生用gpt -4 : 去產生高質量多模態數158k 極小量數據集用8xA100 1天時間就幹爆之前所有 : 多模態大模型能打贏saleforce的一間大公司堆出來的多模態BLIP-2模型 : 這傢伙精髓站就是在gpt-4模型巨人的肩膀上 : 資料的quality會影響大模型而資料可以透過開源高質量模型去萃取 : 如果再套用COT 這些都可以繼續進化 paper有些細節像是數據集這類如何精煉 : 反而可能會是一個重要一環但大家都會藏這類細節 @@/ : 2025現在大家都殺到LLM Agent去了 LLM刷模型任務分數熱潮有點下降 : 大部分都跑去搞LLM決策部分和COT (思考鏈) 多步驟分析任務 : 像是waymo自駕端對端的決策都搞了一個EMMA 用Gemini 去往上蓋 : (這時候自駕公司有自己的很強的LLM就很有用了隨手不負責預測亞麻zoox會拿自家 : LLM或anthropic來搞end-2-end多模態) : 然後LLM Agent如果要放在機器人和自駕 : 一定得on-device 因為雲端延遲太慢風險高所以1B~4B這陣子的on-device模型 : 能力也在不斷突破所以on-device LLM不太會在是AI-PC 除非是屬於私密資料等應用場景 : 而edge/on-devcie AI 可能突破點會在機器人 : 自駕的趨勢之後會跟LLM走上同陣線在某個時間點等閉源LLM開始時就是差不多AI模型 : 的盡頭開始產業化也許端對端LLM決策可以強化視覺上標籤數據不足 (不確定這點 : 但直覺上認為思考練LLM Agent可以降低場景車用數據量..QQ 基於模型泛化能力) : 這會給其他車廠追上特斯拉的機會特斯拉自身的LLM可來自grok 而3D基礎模型 : foundation model 像是李飛飛的空間模型有一定機會能幫助自駕可以直接融合LLM : 產生端對端多模態而李飛飛又跟狗家走很近所以想單賭個股可以賭賭看狗家 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 67.150.123.92 (美國) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737951957.A.14E.html

→ LDPC : =_= https://reurl.cc/vp2dgj 請大大刪上推文01/27 12:29

你才是大大改好了：）

→ lucien0410 : wow 01/27 12:29

※ 編輯: lucien0410 (67.150.123.92 美國), 01/27/2025 12:30:35

噓 musie : 哪裡來的菜雞 OpenAI的lib已經是standard protocol 01/27 12:30

→ musie : https://ai.google.dev/gemini-api/docs/openai 01/27 12:30

→ dosiris : 開源還想賺錢哪個開源軟件有賺錢 01/27 12:30

推 Brioni : 你這個AI圈的人應該都知道了，以為只有你知道？ 01/27 12:31

推 sali921 : 開源的也沒啥阿 01/27 12:31

推 ggian123 : 相信股板AI大師一定是抄的偷的我們知道天安門 01/27 12:32

噓 qwe78971 : 是不是菜雞啊到底知不知道自己在打啥文章 01/27 12:33

→ lucien0410 : 我的確是菜啊 m大分享知識感恩 01/27 12:34

噓 Samurai : 不懂沒關係，不要亂講吧 01/27 12:35

→ TaiwanUp : 不是啦是DeepSeek裡面有大巨人在運作啦 01/27 12:35

推 Brioni : 著眼點不同，大神研究模型算法跟效能，有些人只關注 01/27 12:35

→ Brioni : 訓練過程有沒有記得輸入天安門…. 01/27 12:35

→ TaiwanUp : 這樣也被你發現 01/27 12:36

推 dosiris : 說不定華西街不知道求記者報導 01/27 12:41

→ lucien0410 : 我問 “可以談談為什麼毛澤東要發動文化大革命嗎” 01/27 12:41

→ lucien0410 : 他叫我別聊這個聊別的太有趣XD 01/27 12:44

噓 dongdong0405: 笑死這篇超菜那已經是通用的接口格式了 01/27 12:45

噓 matlab1106 : 美國大廠肯定沒請到原po這種人才XD 01/27 12:47

噓 ksjr : ==只是一個名稱而已 01/27 12:55

噓 holebro : 笑死 01/27 13:03

推 tonsofdamage: 笑死，六四天安門不能問 01/27 13:13

噓 lionel20002 : 菜爆www 01/27 13:14

→ previa : 北七，就Restful接口標準化，根boto3去兼容aws一樣 01/27 15:48

→ previa : 連openstack最後都要把api接口做的跟aws兼容 01/27 15:49

→ previa : 你不懂還要硬說人抄襲？ 01/27 15:49

推 s1612316 : 當你發現的時候是不是覺得贏過世界上頂尖工程師了 01/27 16:48

噓 bleeza : 你都發現了，怎麼不做一個台灣人版的deepseek呢？ 01/27 17:37

噓 s213092921 : 你是電你是光，你是唯一的神話 01/27 18:03

推 tangolosss : 算到8964就自動當機這種AI誰敢用?? 笑死 XDDDDD 01/27 18:16

噓 ARui : 你是反串還是菜啊 01/27 19:23