推 h0103661: 但即使是商用,也很少重新訓練 02/01 18:43
→ poz93: 拿來翻譯色遊夠用就算強02/01 18:43
→ shikop: openAI就是來圈錢的02/01 18:43
也就這幾年越來越誇張 openai 本身對ai貢獻還是很大 例如現在語音轉文字的標準還是o
penai開源的Whisper模型
※ 編輯: attacksoil (223.136.50.51 臺灣), 02/01/2025 18:45:26
推 yahoo2720: 從它開源的那刻起 任何嘴它的理由都顯得有點好笑02/01 18:45
沒錯 人家都開源了 真的沒啥好酸
但也不用太過神話 這個Deepseek的衝擊還是沒有當初的llama3和去年的mistral 來的大
※ 編輯: attacksoil (223.136.50.51 臺灣), 02/01/2025 18:47:23
→ zwxyzxxx: 原本歐噴AI 的用處還真的是用來圈錢,結果來不及圈就破功02/01 18:46
→ zwxyzxxx: 美國的科研是很燒錢的,上市的時候圈錢才能繼續走下去02/01 18:46
推 h0103661: openai都多久了,又不是只有一個產品02/01 18:46
推 guogu: 看b站跟這邊一堆人把訓練跟使用混在一起02/01 18:47
→ guogu: 問是不是以後不用老黃顯卡了 是不是可以每台電腦都裝 02/01 18:47
→ guogu: 單機遊戲是不是每個npc都可以用AI 02/01 18:47
→ guogu: 那完全就是兩碼子事==02/01 18:47
如果是想討論顯卡相關
那就是另一篇了
這篇是講訓練 實際跟顯卡相關的是推理
→ zwxyzxxx: 問題是還沒有真的上市阿,之前好像都是找投資02/01 18:47
→ shikop: openAI我覺得還是有優勢啦 但DS出來就是多一個方法幫大家02/01 18:47
→ shikop: 省成本02/01 18:47
推 lianginptt: 阿共仔怎麼可能這麼好心!這一定是孔明的陷阱!02/01 18:48
阿里巴巴開源一堆模型也不是一天兩天的事 只能說有些東西是無國界的
※ 編輯: attacksoil (223.136.50.51 臺灣), 02/01/2025 18:48:54
推 Peurintesa: 我實在很好奇有些人看到"開源" 他想到的開源到底是啥02/01 18:48
※ 編輯: attacksoil (223.136.50.51 臺灣), 02/01/2025 18:50:05
→ Xpwa563704ju: 老實講開源是真的挺佛心的 02/01 18:49
→ shikop: 生命自然會找到出路 越打壓越是如此02/01 18:49
推 lianginptt: 通通不準用!阿共仔會偷你資料! 02/01 18:50
推 ruby080808: 這塊大部分的人都會開源吧,除了openai ==02/01 18:50
推 h0103661: 哪有大部分== 02/01 18:51
推 applehpsh: 沒有一定 你有自信自己搞也進步飛快 沒有一定要開源 02/01 18:51
→ applehpsh: 沒開源的還是遠多於開源的 02/01 18:51
推 jerry7668: 畢竟多數人可能連基礎什麼都不清楚 02/01 18:52
→ jerry7668: 他都敢開源了 02/01 18:52
推 ko27tye: 開源又怎樣 還不是有機會藏木馬! 02/01 18:52
→ applehpsh: 當然先撇開開發國是哪國不講 如果他願意把自己成果開源 02/01 18:53
→ applehpsh: 確實很佛 但如果他的被確認是盜用別人東西是另一回事02/01 18:53
推 vivianqq30: 上篇有人看到阿共開源會想到在裡面偷塞木馬 對啊02/01 18:55
推 Peurintesa: 蛤?你是說開源的盜閉源的嗎?02/01 18:55
偷資料是另外一回事
這裡指的偷資料是用openai api生成的回答來訓練
雖然以開源精神來說 我不覺得偷這種資料有多大的道德瑕疵
但如果有偷 然後還被抓到 那就只能乖乖走訴訟程序
→ vivianqq30: *爆的那篇02/01 18:55
※ 編輯: attacksoil (223.136.50.51 臺灣), 02/01/2025 18:59:54
推 Ipluck: openai自己在網上無視版權亂抓資料訓練模型結果ds出來開02/01 18:56
→ Ipluck: 源後還在那嘴人家抄他們真的很好笑 02/01 18:56
→ poz93: 這杯水乳滑的梗圖 都可以改成這杯水有木馬竊取你資料 02/01 18:57
推 Peurintesa: 我是覺得原碼公開這麼久沒被抓到奇怪的東西應該不至於 02/01 18:58
推 qscgg: r1有開源嗎?我以為只有v3 02/01 18:59
模型有 huggingface可以下載完整MOE
但訓練腳本有沒有開源我沒注意
推 knml: openai要正名closeai才對,看不到哪裡open 02/01 18:59
→ applehpsh: 很多開源軟體和套件都有過因為人為/非人為bug搞出過資 02/01 18:59
→ applehpsh: 漏洞啦 不是開源就一定萬無一失 02/01 18:59
※ 編輯: attacksoil (223.136.50.51 臺灣), 02/01/2025 19:00:53
推 RandyOrlando: 有能力下開源來驗證的幾乎都能抓出有沒有藏木馬好 02/01 19:00
→ RandyOrlando: 嗎 說話之前先思考一下很難? 02/01 19:00
→ lianginptt: 阿人家程式碼擺在那邊,有漏洞你抓出來啊,肚子都剖 02/01 19:03
→ lianginptt: 開了有幾碗粉不會自己看嗎? 02/01 19:03
→ ghostxx: 不把所有事扯在一起講要怎麼抹屎02/01 19:04
木馬真的不用擔心
要擔心的是alignment 的問題
但據我所知 現在技術對alignment的控制力暫時還沒那麼強 應該還可以不太需要擔心...
吧
※ 編輯: attacksoil (223.136.50.51 臺灣), 02/01/2025 19:07:39
推 nbook: 偷openai資料 要不要想一下這些資料哪來的 openai現在還不o02/01 19:07
→ nbook: pen了笑死 02/01 19:07
→ nodefence: 這邊好多沒有版權意識的人 02/01 19:11
推 lanjack: 現在就是偷了被抓到了啊,至於訴訟我看起來像是openai嗎 02/01 19:11
推 zwxyzxxx: 人家歐噴AI 就不開放資料你是要去哪裡偷 02/01 19:12
→ zwxyzxxx: 如果真的能偷到,那是不是反向證明了科技大國的美國資安 02/01 19:13
→ lanjack: 所以我說我看起來像是openai嗎?人家查出是怎麼偷的也沒02/01 19:14
→ lanjack: 講,我會通靈是吧?02/01 19:14
→ zwxyzxxx: 還有保密文件跟紙糊的一樣,對岸民間的隨便公司都能偷到 02/01 19:14
好像真的很多人不知道偷資料是怎麼偷
稍微說明一下好了 如果要偷 偷的方法就是花錢用openai 的api 然後用他產生qa pairs
來做測試資料集
看起來跟正常使用差不多 真的沒那麼好抓 也跟傳統意義上的資安沒有關係
※ 編輯: attacksoil (223.136.50.51 臺灣), 02/01/2025 19:17:14
推 Peurintesa: 確實 畢竟openai都沒版權意識了== 02/01 19:15
推 ZMTL: 其實OpenAI研發副總也在推特上稱讚DS的模型蒸餾,所以OpenAI02/01 19:15
→ ZMTL: 「指責」DS偷我蠻好奇出自哪裡的02/01 19:15
→ ZMTL: 然後如果模型蒸餾侵權能被搞成,OpenAI比較需要擔心他們被美 02/01 19:16
→ ZMTL: 國一堆出版社告偷資料訓練模型會不會成02/01 19:16
他稱讚的模型蒸餾是指拿R3來蒸餾llama3還有qwen吧
至於拿openai 的輸出來重新訓練(蒸餾)是否可以告成功 我也不清楚 但據我所知官方
是禁止的 但還是有漏洞可鑽 (shareGPT之類的)
※ 編輯: attacksoil (223.136.50.51 臺灣), 02/01/2025 19:20:40
推 RandyOrlando: 沒拿出證據然後說抓到了 還硬要上車是.... 02/01 19:25
推 kaj1983: 之前說侵權的那篇文就說了目前沒證據啊,後續吵都多餘的 02/01 19:26
推 haha98: 這版有論文的根本沒幾個 跟他們講也是浪費時間 擬人真好 02/01 19:28
推 hcastray: 我純看戲 不站隊 因為我完全不懂 不過看起來挺有意思的 02/01 19:30
推 kayliu945: 我的看法是這樣啦 02/01 19:33
推 gm3252: 推 02/01 19:35
推 JustWower: 一般人就看AI未來發展怎樣又不用站隊 02/01 19:36
→ JustWower: 急著站隊就那種整天在意識形態的 02/01 19:36
推 crazy6341556: 很多人連蒸餾都搞不清楚 deepseek被太多外行關注了 02/01 19:41
推 Peurintesa: 要看論文直接搜尋就有啦 02/01 19:43
推 uohZemllac: 推 02/01 19:44
→ a3294814: 內行 02/01 19:48
噓 adonisXD: 上課教材或影片文本偷別人的你覺得ok? 02/01 19:52
推 tank44444: closeAI 02/01 19:54
推 Peurintesa: 還在講偷來的我都不知道是在酸誰耶 02/01 19:55
→ trialmoon: 比當初講解大谷合約還痛苦= = 無限跳針+根本看不懂英文 02/01 20:04
→ trialmoon: 的一堆 02/01 20:04
推 lovevul3s06: gpt訓練時的東西全部都有經過同意嗎 還是未經別人同 02/01 20:06
→ lovevul3s06: 意拿來用 02/01 20:06
噓 Kazuma0332: 誰最怕DS被說偷竊,就是在酸它 02/01 20:06
推 busman214: 連中文起訴書都不想看的人怎麼會看英文論文XD 02/01 20:06
推 WatsonChao: 吵偷真的好笑,強者會找優點弱者只會找缺點 02/01 20:15
→ R620SCANIA: 8964占占占 deepseek快抓網路文章訓練喔 02/01 20:20
推 b05605019: 推 02/01 21:48
推 Haruna1998: 他敢開源我看只有傻逼喜歡嘴人家吧 02/01 21:57
推 ilove640: 沒辦法 有的人眼中就是只有政治 發表後整串文討論AI的 02/02 00:00
→ ilove640: 可能沒有10% 真不覺得這樣是好事= = 02/02 00:00
→ arx3721: 天才支那少女的抄襲之作然後驚艷兩天翻車 C洽還可以出現 02/02 03:40
→ arx3721: 這種文章… 02/02 03:40