看板 Gossiping 關於我們 聯絡資訊
1.媒體來源: iThome 2.記者署名: 文/李建興 | 2025-01-31發表 3.完整新聞標題: Hugging Face逆向工程DeepSeek-R1,將打造開放推理模型Open-R1 4.完整新聞內文: 中國人工智慧公司所開發的DeepSeek-R1模型發布以來,相對低廉的硬體與訓練成本就能 展現高水準推理能力,在市場引發極大震盪。Hugging Face現正根據DeepSeek所公布的研 究內容進行逆向工程,試圖推出名為Open-R1的開放版本,期望在透明、可驗證的環境下 讓研究社群能更深入了解該突破性技術。 由於DeepSeek-R1以遠低於市場預期的成本達到與先進模型相近的推理表現,業界與學界 都希望能了解技術全貌,但DeepSeek未公開完整的訓練資料集與程式碼,使得外界對其稱 為開源模型的真實性存有疑慮。Hugging Face工程師認為,如果只釋出模型權重與部分技 術報告,仍不足以滿足真正的開放標準,因而決定透過逆向工程與大規模協作,建置完整 可供研究者自行驗證與調整語言模型,成為推理模型的開放訓練工作管線與資料集。 深度學習社群之所以對此舉格外關注,主要是因為DeepSeek-R1在數學、程式開發與科學 領域的推理能力,甚至能與知名的OpenAI o1模型一較高下,而開發成本卻聲稱僅有美國 人工智慧公司花費的一小部分。一旦Hugging Face成功重現Open-R1,研究人員將可確切 掌握其中關鍵架構、訓練步驟,以及在有限硬體資源下達到高效訓練的方法。 目前Hugging Face團隊的做法,是先分析DeepSeek發布的技術報告與模型論文,並嘗試從 現有權重中推斷其訓練配方與資料分布。由於DeepSeek並未開放完整的資料集與程式碼, Hugging Face需要召集志願者,共同整理出可供公開使用的高品質推理資料,藉此復刻或 接近DeepSeek-R1所使用的多階段訓練策略。 當Open-R1順利出爐,將不只是一個DeepSeek-R1複製品,更可能在技術透明度與研究價值 上進一步超越原始模型。Open-R1可供任何人檢閱並改良強化學習流程、語言模型結構以 及推理邏輯。這對需要確保模型輸出精度與可控性的企業而言相當重要,也進一步突顯了 開源社群在推動人工智慧技術發展時所扮演的關鍵角色。 Open-R1模型的訓練將使用Hugging Face的Science Cluster運算資源,該叢集有96個節點 ,每個節點有8張顯示卡,共768顆Nvidia H100可用於密集訓練,Hugging Face預計在數 周內推出第一個可公開測試的原型版本。 5.完整新聞連結 (或短網址)不可用YAHOO、LINE、MSN等轉載媒體: https://www.ithome.com.tw/news/167171 6.備註: 當有一群人在64天安門上做文章否定DS模型的表現時, 另一群人正在想辦法山寨DS 而拿200E預算的前部長則是拿著破解64天安門問題洋洋得意 話說回來,我當天早上就已經破解的東西有什麼好吹的? https://www.ptt.cc/bbs/HatePolitics/M.1738028624.A.374.html -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.232.109.183 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1738370588.A.E53.html ※ 編輯: purplvampire (118.232.109.183 臺灣), 02/01/2025 08:43:52
kensmile: 台灣已經開始落後 49.218.89.243 02/01 08:44
AWPER: 怎麼不來逆向200億的點麵線系統? 49.217.61.253 02/01 08:44
ggbi4zzz: 200億點麵線可以逆向嗎?114.136.222.128 02/01 08:44
akito209: 美國會點麵線嗎 不會就閉嘴 台灣遙遙領116.241.213.173 02/01 08:45
akito209: 先116.241.213.173 02/01 08:45
kensmile: 數発部的功能,只有點餐,出國考察 49.218.89.243 02/01 08:46
love80: 數位部:禁止全民使用大陸軟體,刁民只配 180.177.3.200 02/01 08:46
love80: 使用偉大的點餐軟體 180.177.3.200 02/01 08:47
MicroB: 前部長應該也沒得意吧?是黨媒自己在那得意 45.144.227.29 02/01 08:47
lyxiang: 這才是讓AI技術進步的正確方式 1.170.203.152 02/01 08:47
scum5566: 用你的魔法對付你? 36.232.169.124 02/01 08:48
chocoball: 我山寨你的山寨180.217.156.203 02/01 08:48
firose: 你們有分析架構;台灣有分析 64! 114.25.142.91 02/01 08:49
firose: 什麼能力做什麼事 怎樣 不爽嗎 114.25.142.91 02/01 08:49
mkopin: 魔法對轟 49.215.88.25 02/01 08:51
marlonlai: 正確做法阿 都開源了先驗證 確定能用的 112.104.147.13 02/01 08:52
marlonlai: 話就嘗試魔改 112.104.147.13 02/01 08:53
qozxcv: 有當年擋疫苗的起手式味道 36.224.22.214 02/01 08:53
sm905202: 到時候OR1查不到64看小鳥要不要出征美國 114.136.228.75 02/01 08:56
ftvs: 一群弄臣 223.139.83.23 02/01 08:56
Paulsic: 不是說抄襲還逆向抄襲的?? 223.23.118.215 02/01 08:58
Paulsic: 有必要淪落成這樣 223.23.118.215 02/01 08:59
perlone: 研究完發現裡面就是抄來的 笑死101.139.185.127 02/01 09:00
wensday: 正常人都是趕快分析 看怎麼利用創新進步 122.100.73.11 02/01 09:01
wensday: 只有台灣一堆反智的在那裡抓不到重點 搞 122.100.73.11 02/01 09:01
wensday: 不清楚狀況 先喊騙局 先查64再說 這就是 122.100.73.11 02/01 09:01
wensday: 政府補助的成果 122.100.73.11 02/01 09:01
nostar: 這跟藍白統刪有87%像 42.71.135.146 02/01 09:04
SRNOB: https://i.imgur.com/icEZnc8.jpeg 101.9.39.182 02/01 09:08
soulivee: https://i.imgur.com/bL3HJRo.jpeg 36.230.97.238 02/01 09:09
cdcardabc: 好了啦中吹 泱泱大國整天只會意淫贏台 42.76.157.4 02/01 09:10
soulivee: chatGPT應該也有偷招 36.230.97.238 02/01 09:10
cdcardabc: 灣超丟臉 不愧是籠的傳人 42.76.157.4 02/01 09:10
koka9900: 美國佬在翻垃圾桶找東西吃了 49.216.20.65 02/01 09:10
qday: 至少比讓DS說64有用 42.72.158.181 02/01 09:14
jim543000: 笑死 直接不演了 直接說我就reverse220.141.198.121 02/01 09:19
ynanlin: 人家追求技術突破,台灣追求意識型態符 42.70.60.144 02/01 09:24
iLeyaSin365: 閩南族群的腦 底部的電路邏輯就是不 223.141.174.82 02/01 09:24
ynanlin: 合黨意,各取所需,沒問題的 42.70.60.144 02/01 09:24
iLeyaSin365: 停檢視自己有沒有被外族統治,然後 223.141.174.82 02/01 09:24
iLeyaSin365: 自己是不是當地最有勢力的 223.141.174.82 02/01 09:24
Beamslee: 用64否定DS 真的很可笑 219.70.200.52 02/01 09:28
yamhome: 不透明就是中國拷貝技術 42.77.85.177 02/01 09:29
REALJOINGO: 滿地開花 不同領域的專武AI要出現了 42.72.145.57 02/01 09:29
game636610: 中共:只能我逆向,憑什麼西方可以逆向 111.255.28.127 02/01 09:34
game636610: ?全世界華人都不同意 111.255.28.127 02/01 09:34
Jerry469: 垃圾數發布 111.82.192.194 02/01 09:36
uller: 我們連發個新聞說在破解ds都懶 只要政治 118.168.14.83 02/01 09:38
shokotan: 中國又贏 1.163.83.250 02/01 09:38
laputaca: qq 49.215.21.249 02/01 09:39
shokotan: 驗證羅福莉團隊真牛逼 中國蘿莉NO1 1.163.83.250 02/01 09:40
splong: 只要一直叫網軍出來洗抄襲、只是中國大外 42.77.185.189 02/01 09:46
splong: 宣就好了,你以為數發部真有能力自己生一 42.77.185.189 02/01 09:46
splong: 個突破性的模型嗎? 42.77.185.189 02/01 09:46
k862479k: 跪著舔爽拿200億 誰他媽要996搞研發122.116.221.108 02/01 10:04
k862479k: 養幾百個米蟲 不及人家一間小公司122.116.221.108 02/01 10:04
void06: 點麵不只爛還貴 這是我們200億部的偉大創 42.71.12.172 02/01 10:11
void06: 作 ai不值一提 42.71.12.172 02/01 10:11
gunfighter: 笑死 國外都神仙打架 台灣只有點麵線 111.82.189.229 02/01 10:13
TaiTY2021: 洗了整個假期夠了沒 42.71.151.220 02/01 10:17
Peurintesa: 本來是期望唐鳳能去幹這種事 結果== 27.247.192.110 02/01 10:20
eko112: 國外大廠:值得研究 台灣:很危險 不能提 114.40.165.243 02/01 10:22
eko112: 64 根本爛東西 我們有點麵線 114.40.165.243 02/01 10:22
metroid0104: 當國外都在驗證重現人家宣稱的成本效 218.173.67.14 02/01 10:27
metroid0104: 能,只有台灣在意識形態上大做文章 218.173.67.14 02/01 10:28
fk1450: 點麵線超強的 27.52.33.96 02/01 10:28
NCUking: 台灣天才部長都破解了 台灣No.1 61.224.205.160 02/01 10:33
capser: http://i.imgur.com/9n48qZc.jpg 學DS ? 123.194.149.63 02/01 10:34
shokotan: 大家現在都在抄中國Deepseek 1.163.83.250 02/01 10:37
fanntasy: 塔綠班畜生崩潰了,沒有完整的開源 123.193.164.94 02/01 10:38
flybow: 彼此相互蒸餾萃取 哈哈哈哈 60.246.44.252 02/01 11:07
kasim15: 井蛙灣灣還再當山頂洞人 49.216.28.107 02/01 11:22
firose: 鳥又翻 114.25.142.91 02/01 11:24
dong80: 原來哈根達斯不是只有賣比冰淇淋 61.30.131.104 02/01 11:25
BABY19831016: 烏又贏 鳥又崩 114.37.98.151 02/01 11:29
Hibria: 台灣已攻破64天安門限制,這些大公司還在 114.137.30.34 02/01 11:30
Hibria: 研究無關緊要的東西,台又贏 114.137.30.34 02/01 11:30
nonsu: 有比我們天才it大臣繞過破解還厲害嗎ww 42.76.221.144 02/01 11:31
changefly: 台灣價值你敢嘴223.137.218.134 02/01 11:35
firose: 台灣真他媽的丟臉丟到家 114.25.142.91 02/01 11:40
danny30715: 別人都在往前進步的時候拜託別出來丟 106.64.16.218 02/01 12:50
danny30715: 臉 106.64.16.218 02/01 12:50
marinsky: 部長搞不好看到你的文章才想到的啊 118.166.135.52 02/01 12:55
shala: 開源還要逆工? 64.62.219.22 02/01 13:35
imnaruto: 逆向工程XDD 開始蒸餾你的蒸餾 49.216.128.237 02/01 13:43
Arashi0731: 從這件事的操作就知道唐鳳沒料了…223.138.143.215 02/01 15:43
phasmophobia: 你可以當部長了 223.141.169.45 02/01 15:51
s8800892000: 笑死 人家在破解模仿 台灣在繞過64 223.140.86.139 02/01 18:47
GN02209611: 大臣沒有輸 101.10.106.49 02/01 20:56