看板 Gossiping 關於我們 聯絡資訊
備註請放最後面 違者新聞文章刪除 1.媒體來源:聯合¨ ※ 例如蘋果日報、自由時報(請參考版規下方的核准媒體名單) ※ Yahoo、MSN、LINE等非直接官方新聞連結不被允許 2.記者署名: ※ 若新聞沒有記者名字或編輯名字,請勿張貼,否則會被水桶14天 ※ 外電至少要有來源或編輯 如:法新社 3.完整新聞標題: DeepSeek危險了?「AI教母」出手 AI模型花不到50美元 ※ 標題沒有完整寫出來 ---> 依照板規刪除文章 4.完整新聞內文: 2025-02-08 14:40 聯合報/ 記者 林宸誼 /即時報導 DeepSeek橫空出世引起市場關注,不過被譽為「AI教母」的知名華裔美籍科學家李飛飛領導的團隊,以低於50美元(新台幣1,655元)的雲端運算成本,成功訓練出名為「s1」的人工智慧推理模型。 界面新聞報導,此模型在數學和編碼能力測驗中的表現,據稱媲美 OpenAI o1和DeepSeek R1等尖端推理模型。 李飛飛團隊的s1模型並非從頭訓練,而是建立在阿里巴巴的通義千問Qwen2.5 -32B-Instruct開源模型為底座,在16塊H100 GPU上監督微調26分鐘,訓練出新模型s1-32B, 取得與OpenAI的o1和DeepSeek的R1等尖端推理模型數學及編碼能力相當的效果,甚至在競賽數學問題上的表現比 o1-preview 高出27%。 財聯社報導,大陸某知名大模型公司CEO表示,李飛飛團隊的成就,實際上是利用從Google模型中擷取的1000個樣本來微調通義千問模型。這種微調的成本固然低廉,但優異表現仍有賴於既有模型的基礎。 每日經濟新聞報導,復旦大學電腦學院副教授、博士生鄭驍慶指出,50美元是否包含了其他資料、設備、消融實驗等費用,還要打一個問號。正如DeepSeek-V3不到600萬美元的訓練成本,實際上也只包括了訓練時的GPU算力費用。 鄭驍慶提到,「像DeepSeek或者類似的公司,在尋找有效的整合解決方案時,需要進行大量的前期研究與消融實驗。」這代表前期是需要大量「燒錢」的。 谷歌DeepMind資深研究員Wenhu Chen同樣表示,「真正神奇的是Qwen模型。我們嘗試過把基座模型換成其他模型,用同樣的資料去訓練,但最終並不能達到這麼好的效果。」 也就是說,s1-32B是站在「巨人肩膀」上,且50美元的成本也並沒有涵蓋Qwen模型的訓練費用。 ※ 社論特稿都不能貼!違者刪除(政治類水桶3個月),貼廣告也會被刪除喔!可詳看版規 5.完整新聞連結 (或短網址)不可用YAHOO、LINE、MSN等轉載媒體: https://udn.com/news/story/7333/8535588 ※ 當新聞連結過長時,需提供短網址方便網友點擊 6.備註: 摳死當之後在摳死當~比你更便宜~大家一起把AI這塊餅做好做大 反觀 ※ 一個人一天只能張貼一則新聞(以天為單位),被刪或自刪也算額度內,超貼者水桶,請? ※ 備註請勿張貼三日內新聞(包含連結、標題等) ----- Sent from JPTT on my Samsung SM-G998B. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.192.188.192 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1739106761.A.D2F.html
RisingTackle: 還以為是講唐鳳 106.105.2.49 02/09 21:13
zzzyyan: 這新聞出來 危險的不是DS吧.. 114.46.23.169 02/09 21:13
tetani: 5樓肛門危險了111.255.253.146 02/09 21:13
mikasamikoto: 樓下你比較相信我是金城武,還是他? 49.159.24.75 02/09 21:13
olaqe: 這名字聽起來不像台灣去的123.193.235.208 02/09 21:13
laughingXD: 白癡 203.70.112.167 02/09 21:13
Freeven: 蛤??? 49.216.162.253 02/09 21:14
james732: 這不算蒸餾嗎 180.177.2.111 02/09 21:14
talrasha: 糙灰達:不要再說了122.118.149.150 02/09 21:14
R620SCANIA: 台灣有唐宗漢 台灣有杜義警 42.70.162.57 02/09 21:15
duxxlux: AI內捲 223.139.96.230 02/09 21:15
kevinpc: 先確認李飛飛是哪國人再決定能不能用 1.163.200.6 02/09 21:15
qxpbyd: 這個就真的是蒸餾123.192.158.168 02/09 21:15
Nexpring: 啥118.170.213.111 02/09 21:16
aggressorX: 很快就要免費了 爽 61.230.138.190 02/09 21:17
AustinRivers: zzzz 39.15.56.170 02/09 21:17
angelday3: 祖克柏: 101.8.23.128 02/09 21:17
pooznn: 她拿中国+美國的模型做的 就她的政治傾向 61.228.0.6 02/09 21:18
ffdreamer: PTT創世神杜奕瑾的版本在哪? 114.36.172.65 02/09 21:18
StylishTrade: AI也懂刷題XD111.250.150.196 02/09 21:19
Hsins: 說的好像飛飛是台灣人了 114.35.85.89 02/09 21:20
SRNOB: 32b zz 111.255.77.140 02/09 21:20
bumerang: 人家敢開源公開論文不就早料到這種事會 2.56.252.186 02/09 21:21
StylishTrade: 這是說AI一直刷題會愈來愈強111.250.150.196 02/09 21:21
bumerang: 發生 笑死 2.56.252.186 02/09 21:21
StylishTrade: 不需要給他新的資料111.250.150.196 02/09 21:21
qwer338859: 開源的東西 危險什麼????? 49.158.101.161 02/09 21:21
StylishTrade: 一直刷一直刷說不定就超越人類了111.250.150.196 02/09 21:22
yao03911: 台灣會有ai人妖嗎 110.28.34.161 02/09 21:23
qk3380888: 華人互卷 59.115.181.74 02/09 21:24
kentyeh: 50鎂是電費,不包硬體 223.138.52.18 02/09 21:25
garry5566: 這只是fine tuned吧? 218.35.146.107 02/09 21:25
uranuss: 寫這篇文的不覺得其他人更危險嗎 111.240.149.42 02/09 21:25
beast1969: 李飛飛這名字就像中國人 61.70.168.155 02/09 21:25
metcc80211: 我真的笑死 1.200.1.98 02/09 21:26
franzos: 當台灣還再吹主權 人家AI每秒都在成長 111.82.124.79 02/09 21:26
metcc80211: 在之前怎麼都沒出來顛覆gpt呢?ds開 1.200.1.98 02/09 21:27
metcc80211: 放源碼就每個自稱怪才都出來了 1.200.1.98 02/09 21:27
k1k1832002: 知道Qwen是哪裡的嗎? 中國阿里巴巴的 36.237.152.218 02/09 21:28
k1k1832002: 覺得這只是繞個彎去尻OPENAI的意思 36.237.152.218 02/09 21:28
olaqe: 中國副教授aka博士生 好詭異123.193.235.208 02/09 21:29
love80: 笑死 推出第二天就被台灣天才大臣破解了 180.177.3.200 02/09 21:29
NotOtaku: 很好啊,不讓OpenAI 壟斷,一起促進ai 1.165.245.95 02/09 21:30
NotOtaku: 發展 1.165.245.95 02/09 21:30
Bookhsu1227: 卷起來 180.217.4.73 02/09 21:34
simon0529: 所以台灣呢? 台灣的在哪裡? 220.136.137.63 02/09 21:38
StarTouching: 都是中國人 就是不干台灣的事 114.46.233.16 02/09 21:40
IntoHebe: 這明顯是在酸DS阿 看不出來嗎 61.231.197.203 02/09 21:41
odaaaaa: OPENAI 要Close,就Close 1.200.159.1 02/09 21:42
kikujiro: 看成AI母豬111.252.117.131 02/09 21:42
johnny7757: AI滿地開花 太爽了嗎 科技大躍進 61.61.53.104 02/09 21:44
B9702115: 靠google有啥好報 39.15.72.184 02/09 21:45
woulin: 她是美國籍了,她老公是美國白人118.161.164.201 02/09 21:46
pinhanpaul: 這不就是拋磚引玉的道理嗎 他成功了 118.169.19.18 02/09 21:47
kevincatno1: 嗯 相信不久5090就能支撐AI大模型118.168.221.124 02/09 21:48
davidrockcom: 李飛飛是中裔美籍,也真的很強,沒182.233.248.107 02/09 21:49
davidrockcom: 什麼意外的182.233.248.107 02/09 21:49
CLOSED: 李飛飛就是中國人 199.101.196.10 02/09 21:49
DMM: 白癡 DS損失多少closeAI損失多少?121.112.171.146 02/09 21:50
inconsequent: 結果是抄googleㄛ 61.223.254.230 02/09 21:57
abadjoke: google+阿里巴巴的數據打底 便宜可以想 101.8.49.79 02/09 22:17
abadjoke: 得到 101.8.49.79 02/09 22:18
kimkim9988: 兩百億麵線點 哭死 203.190.20.137 02/09 22:20
zelkova: DS有啥危險的 人家不是開源ㄉ? 1.161.53.79 02/09 22:21
bor1286: 李飛飛,學AI的人應該都有聽過 42.75.21.68 02/09 22:22
vvnbear: 不是吧?之前青鳥洗說不可能這麼便宜,114.137.126.171 02/09 22:23
vvnbear: 現在有更便宜的出現,青鳥缺不懷疑了?114.137.126.171 02/09 22:23
ariz283: 好 112.78.73.61 02/09 22:24
drmitseng: 這就是蒸餾啊 61.227.205.1 02/09 22:30
CalvinS: 根本嚇尿的就不是DS吧 125.227.8.44 02/09 22:32
aaalexxx: 反觀 200億 XDDD 27.53.224.234 02/09 22:33
jhjhs33504: 這相當於有牌的拼裝車 零件還是二手的 1.162.102.112 02/09 22:33
yianhua: 這不是很好嗎,怎麼覺得openai越來越慘223.139.172.154 02/09 22:34
yianhua: 200億點麵線趕快開發吧223.139.172.154 02/09 22:34
jhjhs33504: 品質不太好 DS自研的COT品質是很好的 1.162.102.112 02/09 22:35
GN02209611: 有唐鳳厲害? 118.150.4.7 02/09 22:36
ayakiax: 為什麼要花幾百萬僱用我寫一個50塊的AI211.120.236.176 02/09 22:41
semind: 比捲,美國華人都是從中國捲出來的佼佼者 108.7.213.78 02/09 22:44
semind: 你以為是美國跟中國比,但真正比賽長這樣 108.7.213.78 02/09 22:45
semind: https://i.imgur.com/8OxUj9z.jpeg 108.7.213.78 02/09 22:45
k374318: AI沒這麼值錢了,泡沫破裂了 49.218.138.200 02/09 22:45
gunfighter: 國外神仙打架 台灣繼續點麵線223.141.250.136 02/09 22:46
cgser: 還以為是唐鳳 111.82.213.28 02/09 22:46
SuperBig78: 讚啦 捲起來 1.200.57.99 02/09 22:49
cluclu: S1我懂現在都改叫SONE 近期有大物新人 61.227.239.229 02/09 23:02
b9513227: 各種成本詐欺仔 101.12.156.133 02/09 23:02
xabcxabc0123: 是開抄了沒… 111.82.73.103 02/09 23:13
jhjhs33504: 不知還改了啥? 好像只有搜尋能力很強 1.162.102.112 02/09 23:21
DimlyLit: 到底有幾個爸爸、媽媽111.240.159.164 02/09 23:34
JH10: 明天概念股又要大跌了?? 39.12.120.204 02/09 23:35
justiceyes: 蠢鳥:不回答64,我可是不承認的哦 220.137.1.151 02/09 23:36
Sougetu: 綠媒又在亂吹 1.163.7.199 02/09 23:39
jhjhs33504: 跑這模型不太能量化太多 只能用一點 1.162.102.112 02/09 23:46
chunfo: 慘的是nv 61.223.232.96 02/09 23:56
Looming: 中國人在那邊互相抄來抄去? 194.195.89.178 02/09 23:58
coolrgin: 我是AI養父 27.53.72.1 02/10 00:02
gotofumihisa: 50收 101.10.219.104 02/10 00:35
pchion2002: 50美元??? 39.10.8.101 02/10 00:42
jialin6666: 華裔,中國移民。ImageNET 223.136.20.54 02/10 00:45
jhjhs33504: 應該說不耐量化處理 但有內建提示工程 1.162.102.112 02/10 01:13
cloudpart2: 有競爭是好事123.193.230.139 02/10 01:24
logitech2004: 輝達: 60.249.34.177 02/10 01:58
steven3abc: finetune跟pretrain model不能放在一 220.141.8.22 02/10 03:10
steven3abc: 起比吧... 220.141.8.22 02/10 03:10
AgentSkye56: AI教母 不是唐鳳的點麵線嗎 101.12.152.223 02/10 03:50
kenjip1p2: 50鎂 可以進口兩次藍牙耳機 111.252.24.242 02/10 04:09
Smallsh: finetune吧? 223.139.36.12 02/10 04:18
NPITGOD: 不是我大美帝的產品就往死裡打啦 220.156.12.130 02/10 05:55
henry46277: 不太信阿 會開源讓大家看看代碼長 49.217.133.41 02/10 06:44
henry46277: 怎樣嗎? 49.217.133.41 02/10 06:44
a9564208: 笑死,還有人質疑李飛飛? 101.9.32.59 02/10 07:06
mimicqneb: 台灣之光? 111.252.71.43 02/10 07:16
twn65w65: 結果人家敢公開原始碼就搓破泡泡了 49.215.20.255 02/10 07:46
twn65w65: ,後續你說什麼都沒用 49.215.20.255 02/10 07:46
zxfer: 抄得好 抄得妙 抄到全家都卷起來 223.141.142.85 02/10 08:00
daye2012: 這是假新聞還報那麼爽 27.53.96.217 02/10 08:04
sherming7322: 點麵線錯了嗎 101.139.44.111 02/10 08:20
Poaceae: 微調跟從頭開始訓練成本本來就差很多114.136.234.227 02/10 08:25
Poaceae: 記者是把大家當白癡喔114.136.234.227 02/10 08:25
chenchunjui: 成本當然不含設備 廢話很多 114.136.255.19 02/10 09:55
kurtsgm: ai天才少女 ai教母 下一個是? 114.136.79.119 02/10 10:03
GGininderla: 記者本身是白癡不是把人到白癡114.136.242.122 02/10 10:27
joe33144: 第一個做的人被當韭菜割 27.52.3.250 02/10 11:21
CTUST: 開源就是大家一起死 114.136.215.88 02/10 11:32
hhbbookao: 感覺一個比一個簡單就能超越前者 就是 61.62.234.33 02/10 16:39
hhbbookao: 太簡單了 天才不願作 61.62.234.33 02/10 16:40