看板 Tech_Job 關於我們 聯絡資訊
OpenAI 強大新勁敵,中國 AI 公司 DeepSeek 令矽谷震驚 https://bit.ly/4hxOiYJ 中國幻方成立的 AI 研究公司 DeepSeek 公布最新研究成果,震驚了全世界,無視美國阻止 中國發展尖端科技的野心。 幻方的創始團隊在 2015 年組成,其中代表人物為梁文鋒,團隊從零開始探索全自動化交易 ;到了 2015 年創立幻方量化,依靠數學與 AI 進行量化投資。來到 2023 年 4 月,幻方 宣布成立一家研究公司 DeepSeek 以探索 AGI(Artificial General Intelligence,通用 人工智慧),本週 20 日釋出的 DeepSeek-R1 模型正式版,在 AI 業界掀起熱烈討論。 「今日發表 DeepSeek-R1,同步開源模型權重。DeepSeek-R1 遵循 MIT 授權條款,允許研 究人員以蒸餾技術用 DeepSeek-R1 訓練其他模型」,DeepSeek 表示,而 DeepSeek-R1 基 準測試結果可說是追平 OpenAI o1。 同樣在 20 日,中國國務院總理李強主持由專家、企業家及各領域代表參與的座談會,聽取 政府工作報告並提出建議,梁文鋒正是其中一員,以自身經驗對 AI 發展提出建言。 來自美國的 OpenAI 和 Google DeepMind 率先開發推理模型,這是一種相對新穎的 AI 研 究領域,試圖使模型接近人類認知能力。其中,OpenAI 先後發表 o1、o3,Google 則有 Ge mini 2.0 Flash Thinking Experimental,雙方對研究方法保密到家。 DeepSeek-R1 釋出在矽谷引發激烈爭論,重點在於資源相對充足的美國 AI 公司,是否能夠 持續捍衛自身技術優勢。 華盛頓當局禁止 NVIDIA 向中國供應最先進的晶片,無法建構充足算力下,中國當地 AI 公 司被迫找出創新方法,盡可能提高既有晶片的算力,而梁文鋒的團隊知道如何解決這樣的問 題。 DeepSeek 宣稱,使用供應中國市場的 2,048 個 NVIDIA H800 和不到 600 萬美元訓練一款 擁有 6,710 億參數的模型,所需費用遠遠不及 OpenAI 和 Google 訓練同等規模的模型。 不只如此,DeepSeeK 願意開源分享研究成果,而不是為了商業利益而保護它。DeepSeek 未 從外部資源籌措資金,是靠母公司在對沖基金交易的收益支撐,也沒有採取重大措施將模型 商業化。 加州大學柏克萊分校的 AI 政策研究員 Ritwik Gupta 表示,DeepSeek 近來推出模型表明 「AI 能力沒有護城河」,認為第一個訓練模型的人必須耗費大量資源才能達成目標,但後 進者能以更便宜、更快速的方法辦到。他補充說,中國比起美國擁有更龐大的人才庫,他們 了解如何充分利用運算資源,以更便宜的方法訓練、運行模型。 業界人士則表示,儘管 DeepSeek 以有限資源取得受人矚目的成績,但隨 AI 產業發展,能 否繼續保有競爭力仍是一個大問題。DeepSeek 面對的美國競爭對手並沒有坐以待斃,他們 利用 NVIDIA 下一代 Blackwell 架構晶片建構運算叢集,強大算力有助於拉開競爭差距。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.232.174.138 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1737806116.A.0EE.html
TyuzuChou : 老黃老早就說過了150.117.197.216 01/25 20:28
admon : 先進晶片裡跑一堆垃圾雜訊223.138.200.204 01/25 20:31
SabreN : 如果成真,那幫美股大科技們哭哭, 36.237.101.106 01/25 20:36
SabreN : 幾千億美元的資本支出白花了,但可 36.237.101.106 01/25 20:36
SabreN : 能嗎? 36.237.101.106 01/25 20:36
enso : 要deepseek 自介,結果自稱chat gp123.192.176.165 01/25 20:53
enso : t 4這就是中國研發123.192.176.165 01/25 20:53
rodion : 內建習近平思想的AI 就問你怕了沒 123.195.45.161 01/25 21:10
jW72 : 中國又在徵文比賽了喔之前的電動車 114.136.174.18 01/25 21:21
jW72 : 呢? 114.136.174.18 01/25 21:21
cecille : 看過一個比喻很傳神:從頭到尾. 從 119.77.142.25 01/25 21:31
cecille : 採買到煮菜完成一到料理-》 美國A 119.77.142.25 01/25 21:31
cecille : I巨頭。買半成品再研究怎麼煮的快 119.77.142.25 01/25 21:31
cecille : 又好-〉 deepseek 119.77.142.25 01/25 21:31
Basket0205 : 上車的是 114.25.202.49 01/25 22:40
MisterSmile : 中國的DeepSeek比美國還自由開放 42.70.229.39 01/25 23:04
zerobx : ok 調高AI關稅200% 61.228.77.172 01/25 23:18
cityhunter04: 繼續吹,看吹多久能成功.. 114.24.100.161 01/25 23:29
IMBonjwa : 純噓16 F 49.216.104.225 01/25 23:36
Fegnzi : 本來以為科技版會就事論事素質比八 101.10.56.192 01/25 23:52
Fegnzi : 卦版好一點結果素質比八卦版更糟XD 101.10.56.192 01/25 23:52
camerara : 恐內建豆包人工智障 123.193.30.27 01/26 00:12
MTKer5566 : 科技版炫耀薪資下限用的,一堆打工 114.137.33.171 01/26 00:48
MTKer5566 : 宅 114.137.33.171 01/26 00:48
centra : 如果成本優勢極大,那美國AI相關公 114.137.160.74 01/26 01:08
centra : 司的股價應該就崩盤了 114.137.160.74 01/26 01:08
stockking11 : 又遙遙領先 118.238.217.4 01/26 01:26
dc177674 : 純噓6樓,你真的有去問他自介嗎 111.71.24.209 01/26 02:04
BoXeX : 這邊大概一堆人搞不清楚open sourc 36.234.253.246 01/26 02:54
BoXeX : e的意義吧 36.234.253.246 01/26 02:54
s213092921 : http://i.imgur.com/nxhV6z5.jpg 223.140.65.30 01/26 05:53
scitamehtam : 文組ID只 只剩下「吹」這等級的用 223.136.89.63 01/26 06:33
scitamehtam : 詞,畢竟根本AI 哈哈 223.136.89.63 01/26 06:33
scitamehtam : 這要討論起來,文組青鳥大概,什麼 223.136.89.63 01/26 06:34
scitamehtam : 都插不上話,只能靠逢中必反的政治 223.136.89.63 01/26 06:34
scitamehtam : 立場來模糊焦點,大家繼續觀察就知 223.136.89.63 01/26 06:34
scitamehtam : 道那幾個特定人士在洗了XDD 223.136.89.63 01/26 06:34
scitamehtam : *畢竟根本不懂AI 223.136.89.63 01/26 06:34
mike0 : 一堆政黑柵欄關不住,跑來丟人現眼 101.12.22.75 01/26 07:54
cplusplus426: 我看又是the 抄 136.23.35.32 01/26 08:01
houseguy : 中國人才內捲是可以搞出一些東西, 182.234.97.156 01/26 08:17
houseguy : 只是台灣不屬於中國,宅男發財還是 182.234.97.156 01/26 08:17
houseguy : 宅 182.234.97.156 01/26 08:17
beariscut : 這推文是科技版?根本是奴隸版 118.166.21.204 01/26 08:18
otaku690 : Scale.AI CEO: “My understanding 50.209.152.73 01/26 08:32
otaku690 : is that DeepSeek has about 50,000 50.209.152.73 01/26 08:32
otaku690 : H100s—which they can’t talk ab 50.209.152.73 01/26 08:32
otaku690 : out, obviously, because it is aga 50.209.152.73 01/26 08:32
otaku690 : inst the export controls that the 50.209.152.73 01/26 08:32
otaku690 : United States has put in place. 50.209.152.73 01/26 08:32
otaku690 : ” 50.209.152.73 01/26 08:32
sean44555 : 這裡的老人有幾個看得懂AI的都難說 223.137.103.48 01/26 08:56
Lhmstu : 怎麼這麼多,丟人現眼的... 1.162.105.141 01/26 09:04
wts4832 : 只能證明對中國的晶片禁令還不夠嚴 49.216.40.160 01/26 09:47
wts4832 : 格,應該是新加坡偷賣太多了 49.216.40.160 01/26 09:47
CoNsTaR : Reddit 有人做實驗,跑deepseek r1 111.240.86.77 01/26 10:04
CoNsTaR : 需要大約 150k USD 的設備 111.240.86.77 01/26 10:04
CoNsTaR : 其實沒到真的很多很貴吧 111.240.86.77 01/26 10:04
bigair888 : …世界上便宜又好用會造成市場失衡 223.138.147.35 01/26 11:49
bigair888 : ,你要先看中國ai有讓美國害怕的實 223.138.147.35 01/26 11:49
bigair888 : 力?有的話,明天七大巨頭科技AI就 223.138.147.35 01/26 11:49
bigair888 : 應該要跌50趴 223.138.147.35 01/26 11:49
dakkk : ai重點是有大數據得天下 中國不缺118.233.142.152 01/26 12:21
dakkk : 數據118.233.142.152 01/26 12:21
dakkk : 只是與西方數據base有差118.233.142.152 01/26 12:21
houseguy : 捲積網路還真適合內捲的國家開發呢 182.234.97.156 01/26 12:32
lolicat : 又遙遙領先 123.194.45.24 01/26 12:38
CoNsTaR : 樓上,現在已經沒有人在用卷積了吧 27.242.132.221 01/26 12:48
CoNsTaR : ,現在不都內積? 27.242.132.221 01/26 12:48
kevinmeng2 : 現在台灣政府的方向就是跟世界脫軌180.217.250.214 01/26 13:16
kevinmeng2 : 你看那數位幣就明白了,從世界先進180.217.250.214 01/26 13:16
kevinmeng2 : 變成對岸差不多的法規了…180.217.250.214 01/26 13:16
blent : 跑 R1 是訓練還是做 inference? 42.77.39.218 01/26 13:46
chaohsiung : 用ChatGPT來訓練較小的模型。不需要222.250.254.135 01/26 14:13
chaohsiung : 大量的人工建構的資料,訓練成本當222.250.254.135 01/26 14:13
chaohsiung : 然比較低。模型參數少了,當然運行222.250.254.135 01/26 14:13
chaohsiung : 成本降低。open ai也有自己的蒸餾模222.250.254.135 01/26 14:13
chaohsiung : 型。跟著做的本來就比較容易222.250.254.135 01/26 14:13
swimbert : 為什麼這麼多明明不懂硬要裝懂的人 123.204.11.251 01/26 15:29
swimbert : 啊 123.204.11.251 01/26 15:29
xy390533kimo: 這我信,強調cp值的國家 42.72.39.127 01/26 16:05
uxy82 : 剛剛試用了一下,以免費仔的立場來 42.78.230.201 01/26 18:08
uxy82 : 說還真的蠻好用的 42.78.230.201 01/26 18:08
kanpfer : 中研院又能用中國模型了 118.231.129.23 01/26 19:28
Iversonshao : 合作才能更強 現在要這樣搞 就是看 49.216.50.236 01/26 19:36
Iversonshao : 哪一邊技勝ㄧ籌 49.216.50.236 01/26 19:36
SkyIsMyLimit: 人家都開源了 數發部還在點麵線223.137.153.188 01/26 20:19
yunf : 同84樓ww 49.216.51.19 01/26 20:47
yunf : https://tinyurl.com/2cmckv3o 49.216.51.19 01/26 20:47
randystock : 共產黨的AI 189.224.250.87 01/26 21:06
johnny7757 : 看到一堆講到中國就高潮的ID就知道 61.61.53.104 01/26 22:04
johnny7757 : 台灣真的沒救了 61.61.53.104 01/26 22:04
slybear : 祖國已成最大贏家,厲害了,我的國 61.228.84.240 01/26 23:39
vjod : 故意炒作的話題,稍差的表現、超低 106.248.243.74 01/27 07:49
vjod : 的cost在AI發展史出現很多次,沒有 106.248.243.74 01/27 07:49
vjod : 一次能成為之後發展重心 106.248.243.74 01/27 07:49
vjod : 成長AI世界只有performance是一切 106.248.243.74 01/27 07:49
Dungeon : 厲害+1 1.47.146.51 01/27 08:20
jessel : 看一堆人這樣都可以崩潰真有趣 99.57.232.89 01/27 10:00
HAPPYISCASH : ptt哪有什麼素質好的版 125.231.113.16 01/27 12:55
HAPPYISCASH : ptt各個版都是互相流動的 125.231.113.16 01/27 12:55
HAPPYISCASH : 推文每個人都進入過八卦版 125.231.113.16 01/27 12:55
HAPPYISCASH : 每個都是柵欄仔 125.231.113.16 01/27 12:55
HAPPYISCASH : 論文跟內部架構都100%免費公開了 125.231.113.16 01/27 12:57
HAPPYISCASH : deepseek架構大家都能採用 125.231.113.16 01/27 12:57
HAPPYISCASH : 而且台灣幾乎沒有ai相關科系跟人才 125.231.113.16 01/27 13:01
HAPPYISCASH : 看不懂很正常 這幾乎是個全新的產 125.231.113.16 01/27 13:01
HAPPYISCASH : 業 125.231.113.16 01/27 13:01
HAPPYISCASH : 台灣只有滿地搞硬體的黑手 125.231.113.16 01/27 13:01
xyz0123 : 台積狗只會顧產線 啥AI都不知道 114.36.64.125 01/27 20:42
BarryBai : 硬體才是比較難超越的…畢竟是物理 114.32.244.126 01/27 20:52
youkiller : 這篇文章應該是deepseek請chatgpt 1.172.237.174 01/28 02:20
youkiller : 撰寫的 1.172.237.174 01/28 02:20
dickey2 : 厲害,量子電腦AI都世界第一,卻做 223.138.24.25 01/28 10:29
dickey2 : 不出N3或更高階的製程 223.138.24.25 01/28 10:29
ROTFL : ds從出名後卡到現在,連聊色都屏蔽 112.78.84.209 01/30 16:10
ROTFL : 了幹 112.78.84.209 01/30 16:10