
推 oeoe : 在資安的前提下,很合理 223.141.233.5 01/29 09:51
「模型蒸餾」簡單來說就是讓小模型學大模型的本事,有點像做菜時的大廚帶徒弟。
想像一個超厲害的大廚,會做一大堆超複雜的料理,但學徒沒那麼多經驗,也沒那
麼多食材可以用,所以大廚會教他一些精華,讓他用更簡單的方法做出類似的味道。
模型蒸餾就是這個概念,讓小一點的AI模型從大模型那裡學習重點知識,變成更精
簡但還不錯的小AI,這樣運算速度更快,也比較省資源。
DeepSeek可以比作是小徒弟。如果它是用「模型蒸餾」這種方式來學習,那就像是它從大
模型(像是OpenAI、Google的AI)那裡學到一些精華,然後變成一個更精簡的模型。
但問題是,如果這種學習沒有經過大模型的同意,那就不只是徒弟學手藝,而是直接偷師
。這也是為什麼美國那邊擔心DeepSeek可能涉及技術偷竊,因為如果它是這樣學習的,那
就像是偷看食譜學做菜,而不是正式學習。
推 SilentBob : 蒸的急了101.10.92.182 01/29 09:51
※ 編輯: boards (112.78.81.247 臺灣), 01/29/2025 09:52:16
推 Alphaz : 不意外 跟tiktok一樣 打不贏就禁150.117.201.51 01/29 09:56
中國拉一根暗管,偷接OpenAI 、Gemini ,你可以?資料還會回傳中國!
※ 編輯: boards (112.78.81.247 臺灣), 01/29/2025 09:59:33
推 dakkk : 偷接有沒有證據呀182.233.179.121 01/29 10:16
→ Alphaz : 都開源了還在偷接XD150.117.201.51 01/29 10:22
噓 sxy67230 : 你說用線上版的我還同意,離線的權 101.10.13.225 01/29 10:24
→ sxy67230 : 重模型原始碼架構都開源,你說會資101.10.13.225 01/29 10:24
→ sxy67230 : 料回傳中國是腦袋秀斗了吧 101.10.13.225 01/29 10:24
推 zxp9505007 : deepseek也沒有要藏 架構都開源 要 24.7.63.0 01/29 10:27
→ zxp9505007 : 抄就抄24.7.63.0 01/29 10:27
噓 dreamweaver2: 都開源了,會禁用就承認技不如人了 180.218.40.63 01/29 10:34
推 roamer1005 : 不ey223.141.238.206 01/29 10:41
→ grayeric : 還在偷接? 網路是撥接的機率比較大123.204.8.35 01/29 10:46
推 alex01 : 就國安考慮這個我覺得正常,自己國 111.250.33.165 01/29 10:49
→ alex01 : 家的內部應該避免使用敵國或是潛在 111.250.33.165 01/29 10:49
→ alex01 : 敵國的產品,然後國內應該好好開發111.250.33.165 01/29 10:49
→ alex01 : ,可惜我們國家的相關部門只會撈 111.250.33.165 01/29 10:49
噓 allen501pc : 有在寫程式的就知道,開源程式碼就 42.72.99.227 01/29 10:49
→ allen501pc : 保證安全是假議題。42.72.99.227 01/29 10:49
嗯
※ 編輯: boards (112.78.81.247 臺灣), 01/29/2025 10:57:46
推 afking : 很多私企本來就限制使用生成式AI了 49.217.130.119 01/29 11:15
→ afking : 離線當然是另一回事 49.217.130.119 01/29 11:16
DeepSeek美用戶資料大量送中
(法新社)
美媒警告 可能導致更嚴格審查
〔國際新聞中心/綜合報導〕在中國短影音平台TikTok持續引發安全隱憂之際,中國低成
本生成式人工智慧(AI)模型DeepSeek引發市場震撼,美國「連線雜誌」(WIRED)報導
,DeepSeek的政策清楚表明,它將大量美國用戶的資料直接傳回中國,可能導致更嚴格的
審查。澳洲工業暨科學部長休斯奇(Ed Husic)也警告,基於隱私考量,對使用DeepSeek
應保持「非常謹慎」的態度。
報導指出,正如同其他生成式AI模型一樣,用戶可以向DeepSeek聊天機器人提問,並獲得
答覆。但DeepSeek在隱私政策中直接表明:「我們將收集的資訊儲存在位於中華人民共和
國的安全伺服器上。」亦即用戶和DeepSeek的對話與提問,及其生成的答案,都可能被傳
送到中國。
據報導,DeepSeek傳回中國的資料,可能比TikTok近年來傳回中國的更多,因為TikTok已
將資料遷移到美國企業的雲端託管,藉此減輕美國對安全的疑慮。此外,對DeepSeek網站
的檢視顯示,DeepSeek似乎也將資料傳送給中國科技巨擘「百度」,以及中國網際網路基
礎建設公司Volces。
DeepSeek坦承 反映北京立場
儘管所有企業都有法律義務,但中國過去十年來頒布一系列網路安全和隱私法規,賦予政
府官員向科技公司索取資料的權力,要求組織和公民都應該「配合國家情報工作」。Deep
Seek甚至公開告訴法新社,它被設計成會以反映北京立場的方式回應。
研究機構Gartner分析師韋倫森指出,對消費者而言,生成式AI模型的建構與運行並不透
明;DeepSeek基本上免費,但用戶是以資料、知識、內容、資訊來換取服務。相較於TikT
ok,用戶與生成式AI模型互動的參與度更高,而且內容更加個人化,影響可能更大,應該
引起更多關注。
https://news.ltn.com.tw/amp/news/world/paper/1689449
※ 編輯: boards (112.78.81.247 臺灣), 01/29/2025 11:20:27
推 jason222333 : 站在巨人的肩膀上 哈哈哈哈哈 223.137.78.2 01/29 11:28
→ jumber : 禁止大家用,然後成立特別小組研究 111.82.133.197 01/29 12:01
→ jumber : ,keke111.82.133.197 01/29 12:01
→ samm3320 : 軍方禁很合理吧42.72.45.173 01/29 12:11
噓 patchy : 怪怪 61.223.224.96 01/29 12:32
推 ab4daa : 崩 61.223.230.182 01/29 12:57
噓 youngglasses: 不要光只會看新聞,學會判斷可以嗎 150.117.243.27 01/29 13:49
→ youngglasses: 已經寫得很清楚開源了,如果送資料150.117.243.27 01/29 13:50
→ youngglasses: 看得到150.117.243.27 01/29 13:50
→ youngglasses: 一直在那邊貼什麼新聞說不安全什麼150.117.243.27 01/29 13:50
→ youngglasses: 之類的150.117.243.27 01/29 13:50
→ youngglasses: 線上版當然是送到別人server,離線 150.117.243.27 01/29 13:51
→ youngglasses: 版開源的你是要送哪裡 150.117.243.27 01/29 13:51
→ youngglasses: 如果今天是離線版開源還送中國那就 150.117.243.27 01/29 13:51
→ youngglasses: 算了,問題是看起來就不是150.117.243.27 01/29 13:51
推 phwu : 一堆美國公司也禁chatgpt就是 118.233.2.190 01/29 13:54
→ jhangyu : 你先說美國海軍有允許使用哪一款線 101.9.131.231 01/29 14:15
截至目前,沒有公開資訊顯示美國海軍禁止使用OpenAI或Google的人工智慧技術。然而,
近期美國海軍已明確禁止其成員使用中國新創公司DeepSeek的AI技術,原因涉及安全與道
德考量。
→ jhangyu : 上AI? 101.9.131.231 01/29 14:15
推 abc21086999 : 線上版的一定會回傳北京啊,禁用很114.136.151.105 01/29 14:20
→ abc21086999 : 正常114.136.151.105 01/29 14:20
推 abc21086999 : 在那邊嘴開源的,你覺得有可能馬上114.136.151.105 01/29 14:23
→ abc21086999 : 搞出一套海軍用的本地R1嗎?用屁眼114.136.151.105 01/29 14:23
→ abc21086999 : 想也知道不可能114.136.151.105 01/29 14:23
推 qwe78971 : 看就知道連GitHub 都不知道 講蘋果 39.14.16.72 01/29 14:38
→ qwe78971 : 手機會被遙控爆炸可信度還高點 39.14.16.72 01/29 14:38
推 e2000 : 這邊一堆中吹,吹到被Dcar輾壓,P223.138.109.130 01/29 15:01
→ e2000 : TT某些版會爛掉,網軍側翼要負責223.138.109.130 01/29 15:01
推 Knudsen : 敝公司任何ai都禁欸 這樣該不會也是 42.77.161.48 01/29 15:08
→ Knudsen : 民進黨派來的 42.77.161.48 01/29 15:08
※ 編輯: boards (101.10.44.11 臺灣), 01/29/2025 15:24:26
推 master32 : 我是覺得有八卦政黑軍武可以聊政治 111.253.56.238 01/29 15:29
→ master32 : 科技板理論上應該要平心靜氣討論技 111.253.56.238 01/29 15:29
→ master32 : 術,期待有巷子內的可以發文講解 111.253.56.238 01/29 15:30
身為ChatGPT研發商的OpenAI,29日對外宣布、該公司已掌握相關證據,能證明DeepSeek
存在侵權行為,指責對方在訓練與開發自己的模型時,使用OpenAI的專屬技術進行「蒸餾
萃取」,成為自己平台的重要基礎養分。
《彭博》一則報導中則提到,有匿名知情人士聲稱,微軟(Microsoft)與 OpenAI 去年
秋天曾啟動內部調查,發現一批疑似屬於DeepSeek的帳號,專門利用ChatGPT的API進行蒸
餾取得資料,隨後官方一次查禁這些被懷疑的帳號,但兩家企業都並未對此做出回應。
※ 編輯: boards (101.10.44.11 臺灣), 01/29/2025 15:47:54
推 rogergon : 不管哪一家,只要沒辦法保密都無法 114.43.151.154 01/29 16:59
→ Royalweger : 用開源出來的東西自己搞應該沒問題 36.230.141.185 01/29 17:06
→ Royalweger : 如果直接用它的服務那可能有待商榷 36.230.141.185 01/29 17:07
這則報導的核心是在指出DeepSeek被指控在訓練與開發自家模型時,涉嫌利用OpenAI的技
術進行不當的「蒸餾萃取」,也就是透過某些方式非法提取OpenAI的專有資料來強化自己
的平台。至於有關開源的部分,開源技術確實可以讓開發者自由使用,但如果是違反了Op
enAI的專利或是有侵犯其資料使用權的行為,情況就會不同。
換句話說,開源的技術是沒問題,但如果使用者未經授權地提取非開放資料,這就是侵犯
知識產權的問題。根據報導,微軟和OpenAI也已經發現並處理過這樣的情況,可能進一步
加劇兩家企業對DeepSeek的指控。
※ 編輯: boards (101.10.44.11 臺灣), 01/29/2025 17:12:55
推 xhung : 根本無法註冊 49.216.50.11 01/29 17:12
→ vsbrm : 一堆公司也禁止使用AI網站,你把公 223.139.92.248 01/29 18:34
→ vsbrm : 司資料給AI分析,難保資料不會被其 223.139.92.248 01/29 18:34
→ vsbrm : 他公司引用到 223.139.92.248 01/29 18:34
推 loveyanzi03 : 軍方 合理吧 101.12.153.33 01/29 20:09
噓 knightwww : 好啦 要崩多久 1.169.97.52 01/29 20:34
噓 Lordaeron : facebook,X,threads,chatgpt 也送了111.241.161.153 01/29 20:47
→ Lordaeron : 用戶資料大量送美啊,這位新人,111.241.161.153 01/29 20:48
→ Lordaeron : 加班辛苦啦。111.241.161.153 01/29 20:48
→ physicsdk : 軍方沒禁才是新聞 至少官方上一定 114.34.77.14 01/30 17:10
→ physicsdk : 要說有禁啦 嘻嘻 114.34.77.14 01/30 17:10
推 straggler7 : 很多公司禁用OpenAI 避免機密外洩 36.229.59.188 02/01 11:58