看板 LAW 關於我們 聯絡資訊
※本人知悉此非我國判決,惟其法系承認先例之故,使本判決在當今與往後之AI時代有其 法學重要性,故主張[判決]應屬合適分類且本文予以保留。 一、判決字號 美國加利福尼亞北區聯邦地區法院 No. C 24-05417 WHA (著作權)(判決) 二、案件事實 Anthropic公司於訓練其大語言模型(Large Language Model, LLM)Claude時, 1) 於網路上自盜版網站以電子形式免費下載數百萬本仍受版權保護之書籍 2) 購買紙本書籍(部分與前項書目重複)且拆除其裝訂後,逐頁掃描, 並以數位化、可搜索式之格式儲存 前二項檔案之建立與儲存,旨在建立永久收藏全世界所有書籍的中央圖書館, 而Anthropic則按欲訓練的LLM從此圖書館中選取適當的資料集、及其子集作為素材使用 三、爭點(濃縮) 以上的任何行為是否有符合[美國]著作權法中,關於合理使用(Fair Use)的規範? **本案兩造皆未爭執LLM模型之輸出是否有侵害著作權,僅著重於訓練(輸入input)過程 四、法院見解(濃縮) ------------------------- 先提供原文判決書,連結取自Reuters https://tmsnrt.rs/3ZL5jIx 另因其分析過程繁複,且不見得同我國法學,故不贅述,僅陳列結論與其立論根據 如欲知悉,請自行參閱上方檔案 ------------------------- 1. 將書籍用作訓練LLM的行為,不逾越合理使用之範疇 - 轉化性使用(transformative use),促進創新 2. 將購買之書籍電子化並儲存於中央圖書館的行為,亦不逾越合理使用之範疇 - Anthropic在電子化購買書籍之過程,未有: a) 創造新複本 **在於Anthropic於掃描後便銷毀原購買之紙本,因此僅是變更儲存方式 b) 產出新創作 c) 散佈現存的任何複本/檔案 3. 任何盜版資源的使用,與合理使用之規範顯有牴觸 五、[強烈的]個人意見 我基本上同意本案法官的見解2、3,也同意見解1的論點,但對其欲達到該結論的路徑 並連帶引用見解2之儲存加以證成的方法有意見。 本案法官將LLM訓練過程類比於人類學習、創作的過程,認為儲存這些資料好比人類 閱讀後以記憶之方式保存;將這些資料用以訓練就如同吾人創作時從過往記憶、參考資料 中擷取的行為。當吾人創作時顯非每次參考資料、回顧記憶便須向原出處提供一定金額作 為支付,LLM也因而不必如此,否則人類將難以有重大創新。 只不過LLM創作的歷程真的與人類有相似性嗎? 除非是天賦異稟,否則常人也無法記得 所有曾閱讀過的資料、參與過的經歷,而當無法回憶且無原有資料時,唯一的管道便是再 次花費(直接購買/間接透過圖書館)去取得資料,前者意味人類的創作有先天的時間限制, 因此每代人才有創作/創新的機會,後者則屬非營利性/具備近用權。可LLM基本上不會有所 謂死亡的情況,且有營利性、低近用權的特徵。基於此,如果同意此LLM與人類學習、創作 有相似的見解,那在LLM影響愈來愈大的當今,長期之下恐將以人類普遍的創造能力做為 犧牲的代價,人類因而不用記憶,有事問LLM/AI。創新的可能性將屬於小眾/擁有未電子 化檔案之人,減少了「刺激」的普遍,也就降低了創新的可能性,對人類的創新反而成為 阻礙,也就跟原先合理使用欲保障的目標有所矛盾。 總的來說,此種直接類比將造成LLM對原著作權人的永久侵害,合理使用雖屬合理,但 應再予以限縮。拙見是限縮至原初創建該模型之時,後續使用該素材的進一步優化模型都 不宜屬合理使用,至於要如何切分,因其隱含的營利性特徵,或以首次對外上線使用較為 適宜。 另外,此案著重在LLM的前半,後半產出的部分並非所爭,但本案法官在判決書中指出 縱使LLM訓練過程尚屬合理,不代表輸出就沒問題,並含蓄點到以本案證據來看,該LLM能 迴避著作權侵害的原因在於模型公司並非實際讓用戶能直接使用LLM,而是透過輔助軟體 將用戶提示語進行過濾,以避免侵害著作權之內容生成,然後再透過輔助軟體過濾掉生成 但可能侵害著作權內容之結果,最後才輸出給用戶。如此看來,那未來的AI爭訟恐怕是跟 前端而非後端有關了,亦即產出之著作權侵害。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.14.42.0 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/LAW/M.1750863561.A.CFC.html
R2003: 補充說明,本案在被告的聲請下,從原本的著作權侵害縮限至 06/25 23:18
R2003: 是否屬合理使用,因此可能存在其他侵犯著作權的情況 06/25 23:20
※ 編輯: R2003 (39.14.42.0 臺灣), 06/26/2025 04:38:42
star1231: 很棒的分享 06/29 06:54