看板 Gossiping 關於我們 聯絡資訊
※ 引述 《shala》 之銘言: : 1.媒體來源: : iThome : 2.記者署名: : 文/王宏仁 | 2025-02-08發表 : 3.完整新聞標題: : 三位臺灣AI專家發起DeepSeek R1改造計畫,要打造繁中版開源授權的推理模型 : 4.完整新聞內文: : 這項計畫將以DeepSeek R1為基礎來進行改造,透過重新訓練模型的方式,並以開源授權 : 釋出模型權重,也就是採取開放權重的策略釋出,最後還會打造新的模型身份與品牌 : OpenAI去年發表了新一代推理模型o1之後,讓眾人看到GAI開始媲美真人博士或軟體開發 : 高手般的解題能力,掀起了新一輪的大型語言模型競賽。春節期間,以開放權重釋出的De : epSeek R1模型,大幅降低了這一波推理模型競賽的門檻,成了全球AI產業的熱門焦點, : 開始浮現客製化推理模型的趨勢。 : 臺灣也有三位AI專家,在2月7日發起了一項臺灣製造大型語言模型計畫,專案代號「自由 : 鋼普拉」(FreedomGunpla R1),希望募資3千萬元,預計在3月底釋出第一版預覽的推理 : 模型。 : 這款引起全球AI圈熱議的DeepSeek R1模型,在論文中揭露了多項媲美甚至超越OpenAI o1 : 推理模型的能力,因為可以部署到本地端,來避免企業自己的機敏資料上傳到網路,而引 : 起AI圈的重視,不過,R1模型簡體版用戶協議中提到自己通過三項中國AI法規的備案,也 : 讓外界擔心這款模型生成的內容偏重於對齊中國價值。 阿肥外商碼農阿肥啦! 其實這兩三個禮拜蠻多知名開源平台都在開源R1計畫,像Huggingface知名的Transformers 框架模型平台就釋出Open R1計畫,還有矽谷新創Unsloth也釋出他們的R1微調程式碼,而且 也證明他拿其他已經SFT很強的語言模型像Llama3.3還有Phi-4做簡單的100步強化學習就可 以讓Llama3.3跟Phi-4自我頓悟出推理能力出來。 這也是DeepSeek R1真正帶給世界的重大影響,大概在未來一個月內就會有更多的人自己開 源出自己的R1模型(搭已有的語言模型)。 當前真正比較大的問題是台灣自己根本就沒有完全從0開始完全屬於自己的語言模型,如果 直接說要弄R1無疑就是還沒學會跑就開始想飛了。 如果使用已有的像Meta的llama來訓練自己的語言模型問題是在當初llama在預訓練的時候是 優先看過大量簡中數據的(至少比繁中多),繁中簡中在詞表徵很常時候是重疊的,那就很 難避免模型模型輸出簡中就是了,所以一直以來真正的命題都不是台灣也要有R1,而是台灣 一直都沒能力自己弄出自己的數據中心然後自研屬於自己而且全國產的語言模型,在台灣大 家都是跟著美國大廠的框架走,這才是真命題。 以上 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.12.27.162 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1739086850.A.177.html
purue: 我們有糖鳳114.136.154.204 02/09 15:44
neo5277: 我也外商碼農阿這計劃我滿支持的阿~ 111.243.108.36 02/09 15:45
neo5277: 他主要不是弄一個繁中是要從R1脫胎一個111.243.108.36 02/09 15:45
freewhite: CheatDpp要問世了223.139.208.109 02/09 15:45
SRNOB: https://i.imgur.com/myw9ipj.jpeg 111.255.83.43 02/09 15:45
neo5277: 原形可以給台灣使用因為MIT授權且目前最111.243.108.36 02/09 15:46
SRNOB: 就台灣政府拿錢去抄一份111.255.83.43 02/09 15:46
neo5277: 快的方法就是這樣做差資料跟$而已 111.243.108.36 02/09 15:46
確實,這樣的方法確實是最快的,我也贊成短期人數少的團隊用這種快方法,但我還是覺得 培養長期台灣訓練語言模型的基礎能力才能治本,這種長期的就是人、錢、資料建置都要到 位,這樣未來我們在AI領域才有競爭力而不是畫大餅。
jhjhs33504: bilibili上已經有教學可以自己蒸餾 1.162.102.112 02/09 15:49
xiemark: DppSick 180.217.21.101 02/09 15:50
jhjhs33504: Huggingface上也有各式各樣數據集可挑 1.162.102.112 02/09 15:53
※ 編輯: sxy67230 (101.12.27.162 臺灣), 02/09/2025 15:53:53
jhjhs33504: 台灣應該不容易普及 持續維護也是問題 1.162.102.112 02/09 15:55
neo5277: 從零到一百學理大家都會了,沒有算力 42.71.89.32 02/09 15:56
neo5277: 未來是拼應用的時代,不是從零開始吹氣球 42.71.89.32 02/09 15:57
neo5277: 很多人都有經驗也有能力在玩蒸餾 42.71.89.32 02/09 15:57
warfarin: 唐風那人弄個口罩都能吹上天 1.200.59.9 02/09 16:04
e2699096: 所以台派也是用ds用的真香嘛 111.71.214.30 02/09 16:04
loking: 沒公司做啊 政府自己做一定失敗223.137.211.182 02/09 16:05
lulumic: cheatDPP R1 39.14.32.102 02/09 16:13
photomac: 搪塞填縫 39.10.48.120 02/09 16:21
qwop5: 我們沒錢 223.140.207.42 02/09 16:31
skullxism: 不是有預算拿超多的數位發展部嗎123.192.154.251 02/09 16:41
cvnn: 不准用 還能拿來改?這哪招? 218.172.17.24 02/09 16:46
rblovetw: 網路上的資料還是看使用者的語系,繁體 31.0.157.41 02/09 17:04
rblovetw: 本來就少 31.0.157.41 02/09 17:04
pyhsiao: taide 不知道是不是train from scratch 119.14.217.52 02/09 20:25
bloody089: 糖鳳詐騙都搞不定了!還糖鳳 39.9.40.96 02/10 13:32