看板 Gossiping 關於我們 聯絡資訊
※ 引述《derekhsu (浪人47之華麗的天下無雙)》之銘言: : ※ 引述《logical01 (logical)》之銘言: : : https://i.imgur.com/omWjjTa.jpeg : : 中國一家人工智慧公司開源 : : 與openAI o1同等級的deepseek R1 : : LLM, 商業利用也可以 : : 這是不是沒再甩美國的AI禁令了? : 不是,這是遵守美國的AI禁令做出來的模型,他們的模型以及以及程式全部開源,公布當天就已經上架 Ollama ,用 qwen 以及 llama 作為 學生模型做出來一個不同參數的模型萃取的小模型,在 32B的 qwen 上達到跟 o1 mini 同等水準。(qwen 是阿里巴巴的通義千問模型,一樣是開源的) : 人家的東西全部開源,當天就可以下載測試,驗證資料都是公開的,使用本地模型,隱私還遠高於雲端模型。 : 全球排名前10的模型除了OpenAI Claude Google 以外,能排進去的只有阿里巴巴跟DeepSeek 其中只有中國的模型開源。 中國+香港 其實有很多個模型,除了以前的bat,通義、文言、元寶, 還有後起直追的抖音雲雀(豆包)跟 第一家以 ai 企業上市但前幾年賠得一屁股的商湯日日新 除了這幾家之外,中國專門搞大模型有名的,至少還有七家(包括deepseek的深求) 深求比較奇葩的地方是他們不算正規特種作戰部隊,像是特別行動計畫徵召. 所以他們不是全都是科班頂尖,不精確的形容就是,不管雞鳴狗盜,反正各顯本事. 科技新創就是這樣,你不一定要當學界業界第一強,認清自己本事到哪,目標合理就好. 所以他們運氣不錯,另闢蹊徑摸到一條路出來.於是獲得超過預期的收穫. 但是十大排行榜這東西並不是一個絕對的評估指標,因為標準都是人訂的... 並且這個排行榜變化性很大,過幾天誰發了一個新模型,搞不好又變了 比如說,我手上一個前十大的榜,現在前十名的中國模型是 深求 跟 零一... 為什麼說這個榜的評估標準不能直接當成選用的考慮依據? 因為測試有他的考慮,但你實際要用的時候,有可能必須要考慮他測試的以外的東西. 比如我最近常說我在叫 AI 幫我寫 未成年不要看 的 AV 劇本, 寫了幾幕後 AI 就開始發神經,公公叫成老公,太太看成娘... 這種問題,你要考慮的就不單純是某個 LLM 排行榜的排名... 中國人比較讓人討厭的地方是,普遍愛出髒手, 像是十之七八都會去弄 GPT 的資料出來訓練自己的模型. 搞了半天,你就是說你用他的測驗卷把自己的小孩卷得比他的小孩考得更好... 第二個就是,中國的商業模型,在中港澳以外的地方不好弄到使用(試用), 因為要必須中國境內的電話號碼. 我曾經為了試用某個模型,繞了一點路弄了一個帳號, 但那個帳號本來是用在它的其他業務項目的, 結果沒兩天,我就接到一個有禮,聲音甜美的女企業窗口經理電話,問我想對她做什麼.. 啊,不是,是問我註冊那個帳號是對她公司的什麼服務有需求,有甚麼可以幫我的. -- 讀者審校網試行版(2018/1/1 更新網址) http://readerreviewnet.processoroverload.net/ (哲、史、法、政、經、社,人文翻譯書籍錯譯提報網) ◎洪蘭"毀人不倦"舉報專區 http://tinyurl.com/ybfmzwne 讀者需自救,有錯自己改... -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.163.122.193 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1737449197.A.878.html
gino0717: 什麼AV劇本 我鑑識一下 220.136.77.217 01/21 16:48
wusbetz: 中國就是人礦,不擇手段,很會捲,但會贏220.135.108.154 01/21 16:53
ccufcc: 捲就是內捲,還會贏? 114.140.137.61 01/21 18:32