看板 Gossiping 關於我們 聯絡資訊
※ 引述《wenchinhsieh (windman)》之銘言: : enAI是聊天機器人ChatGPT的開發商。 : 蒸餾技術可讓開發者利用更大、更強的模型輸出成果,在較小模型獲得更出色的表現,並 : 讓他們在特定任務上以更低廉的成本得到類似結果。 這段一定很多人沒看懂。 正確的說法是,蒸餾可以讓較小的模型(學生)在特定任務上得到比原本的小模型更好, 近似於大模型(教師)的結果。 近似,就不可能比教師模型更好,只會更差。另外由於OpenAI沒有開源,所以這種叫做 黑箱蒸餾。如果可以蒸餾把模型變小可以維持原來的品質,那就一直蒸餾一直蒸餾蒸餾 到1K大小好不好? 還有,他有提到「特定領域」,也就是說是只是一個限定的範圍,而不像是OpenAI或是 DeepSeek要作的是通用的LLM。 你不可能靠蒸餾的方式把模型變小還能在通用領域達到跟教師模型不相上下的水準,這 是違反自然法則的。 另外,使用OpenAI來前處理基本上已經是業界不說的常態,Github上甚至有微調方法直 接教你綁訂OpenAI來作蒸餾,只要你不要做出會威脅到OpenAI的東西,他是不會理的, 網路上幾百個開源模型都是這樣作出來的。 如果OpenAI只能找到這個理由去argue,而不是針對他釋出的權重或是演算法進行爭論, 只代表這東西是真貨。 最後是有關於證據的問題,現在的問題是,OpenAI根本不能提出證據,因為OpenAI已經 在他們的使用條款說過使用API的條款如下: """ 根據 OpenAI 的資料使用政策,自 2023 年 3 月 1 日起,除非您明確選擇與 OpenAI 分 享您的資料,否則 OpenAI 不會使用透過 API 提交的資料來訓練或改進其模型。然而, 為了監控濫用行為,OpenAI 會將透過 API 傳送的資料保留最多 30 天,之後會將其刪除 ,除非法律另有規定。 """ 也就是說,OpenAI如果拿出使用紀錄,那就表示OpenAI根本沒有遵守使用條款,偷偷紀錄 用戶的資料。 那你如果沒有保留用戶的資料,那現在是要用什麼證據來調查? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 175.182.32.109 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1738168760.A.64E.html
badbadook: https://i.imgur.com/uznnxpc.jpeg 60.251.57.70 01/30 00:41
jid: 結論:小偷偷東西怪人裝監視器... 184.183.152.74 01/30 00:41
fanntasy: 這只是民法上證據合法性的問題不影響勝 123.193.164.94 01/30 00:44
vdvd: 果然很中國 49.158.214.249 01/30 00:44
fanntasy: 訴 之後不合法獲取的訴訟是另外之訴 123.193.164.94 01/30 00:45
fanntasy: 簡言之就是一碼歸一碼 123.193.164.94 01/30 00:45
vzerov: 如果openai自打臉等於證明自己才是偷用戶 118.231.169.58 01/30 00:46
fanntasy: 所以你不用做夢說因為說沒紀錄就告不成 123.193.164.94 01/30 00:46
neo5277: 其實連偷都很難定義吧 42.78.103.171 01/30 00:46
vzerov: 資料的小偷喔 118.231.169.58 01/30 00:46
JackTheRippe: 一樓圖不錯喔 42.78.214.69 01/30 00:46
kinda: https://i.imgur.com/Xxfekfz.jpeg 122.116.34.251 01/30 00:46
vzerov: 到時用過openai的反而可以告他,我相信很 118.231.169.58 01/30 00:47
vzerov: 多人為了敲一筆絕對會這麼做 118.231.169.58 01/30 00:47
kinda: 想問蒸餾多個學生 組專家系統 能贏老師嗎? 122.116.34.251 01/30 00:47
fanntasy: https://i.imgur.com/fLO3d2u.jpeg 123.193.164.94 01/30 00:47
fanntasy: 給法律完全沒概念的供參 123.193.164.94 01/30 00:47
你出現幻覺了嗎?我這篇文章有提到訴訟嗎? 我這邊提到的是他如果遵守使用條款,他就不會有去年秋天的資料,他如果有去年 秋天的資料,他就違反使用條款,就這麼簡單而已 ※ 編輯: derekhsu (175.182.32.109 臺灣), 01/30/2025 00:54:54 ※ 編輯: derekhsu (175.182.32.109 臺灣), 01/30/2025 00:56:10
bosmin100: 別理無知天才!這個開源軟體真的很屌 1.173.51.245 01/30 01:12
bosmin100: 花不到20億可以打腫所有ai公司老闆 1.173.51.245 01/30 01:14
Peurintesa: 也只能討錢 技術流出是不可逆的 除非 27.247.132.236 01/30 01:59
Peurintesa: 還覺得那些公開技術文件嚴重造假 27.247.132.236 01/30 01:59
jid: 本來説只花5-6百萬美金(不到台幣2億)過沒幾 174.218.17.31 01/30 03:15
jid: 天漲價變花20億台幣。通膨好恐怖 174.218.17.31 01/30 03:15
fanntasy: 你莫不是假裝 違反條款不訴訟能要幹嘛 123.193.164.94 01/30 03:27
fanntasy: 違反了不起訴他 能讓他少根毛嗎xDD 123.193.164.94 01/30 03:27
fanntasy: 今天openAI就一副要打法律戰了... 123.193.164.94 01/30 03:28
fanntasy: 所以我跟你說別幻想用條款阻止起訴而已 123.193.164.94 01/30 03:29
dingading: 很棒 你的意思是說openAI誣賴他嗎? 1.162.106.74 01/30 06:56
dingading: 讚喔 但我是比較信微軟跟openAI 1.162.106.74 01/30 06:56
dingading: 我記得講的是api 1.162.106.74 01/30 06:57
blessbless: 4 42.71.85.152 01/30 08:55