[新聞] 以ChatGPT撰擬專利可行性評估及其法律風

作者stpiknow (H)

看板Patent

標題[新聞] 以ChatGPT撰擬專利可行性評估及其法律風

時間Tue Jul 11 14:19:24 2023

以ChatGPT撰擬專利可行性評估及其法律風險 https://bit.ly/44Empb2 生成式AI的應用現已無遠弗屆，並延伸至法律的領域。先前媒體即報導，哥倫比亞的法官，在涉及某健康保險公司與一名自閉症兒童監護人間，就孩童是否在醫療保險範圍內的糾紛案件中，使用AI聊天機器人的回答協助其判斷並做出裁決。而在智財權中之專利亦然，本刊上一篇針對ChatGPT檢索專利已做可行性評估，並探討其法律風險，本篇則將聚焦在用ChatGPT撰寫專利之可行性評估，然後針對其可能延伸的法律議題加以探討。一、以ChatGPT撰擬專利與翻譯可行性之評估截至目前筆者的發文日，ChatGPT在專利撰寫與翻譯的表現上，GPT-4的版本是比GPT-3.5 先進的，所以本文就嘗試以GPT-4的版本來做實測說明。首先，一般的專利工作者在進行撰寫專利說明書之前，習慣上都會優先撰寫專利說明書的「心臟」-- 請求項(claims)，請求項又包含方法項、系統項、裝置項，甚至可程式化電腦軟體產品等權利保護的請求範圍。同樣地，在請ChatGPT協助撰寫之前，使用者必須要掌握三個原則：1. 給定人設； 2. 描述問題的背景、特徵或需求要盡可能明確；以及3. 指示欲輸出的內容或格式。根據以上原則，筆者設計了一種客戶針對「浸潤式微影技術」，欲保護該發明的情境進行實測（此情境並非是某一客戶的發明，只是為了實測而虛構出的內容），以下就針對方法項作為範例說明。『若你是一位「資深專利工程師」，今天客戶專注在「晶圓製造」，其技術特徵為「浸潤式微影技術並採用5奈米製程，透過一種高折射率液體，特別是對水的折射率為1.44具有最佳效果，並在極紫外光(EUV)波長100奈米到130奈米的條件下，對晶圓做曝光」，請寫出獨立請求項與其附屬項之方法。』結果，ChatGPT的回應如下圖一所示，雖然ChatGPT將獨立請求項與附屬請求項分開來寫，這使得格式上不太正確，而且也導致依附關係有點錯亂，不過需要稱讚ChatGPT的是，估先不論請求項的品質如何，但整體而言已讓人驚艷，因為請求項的撰寫方式幾乎與專利工程師撰擬出來的樣子很像。甚至於，在獨立請求項中，幾乎每一個步驟的起頭需用動詞作為開頭，感覺ChatGPT似乎也理解到方法項的寫法，ChatGPT能學習到這一點已不簡單。 https://imgur.com/a/vsv3c2Z 圖一，ChatGPT撰寫獨立請求項與對應的附屬項接著，筆者以同樣的問題再問ChatGPT，其回應結果如以下圖二所示，與上一次的回應內容不盡相同。舉例來說，原先圖一的回應內容附屬請求項中所描述的「…，其中在步驟 (a)中，使用的浸潤式微影技術是利用光學聚焦鏡片進行模式轉換」，到了第二次再問時，就變成圖二所回應的描述為「…，其中在步驟(a)中，浸潤式微影技術包含利用液體填充晶圓與投影儀鏡頭之間的空間，以增加數值孔徑並改善分辨率」。 https://imgur.com/OBrz5pj 圖二、以同樣的問題再問ChatGPT，其回應結果與圖一不盡相同這一點可能正好反映出ChatGPT的特色，將既有的專利或技術論文等文本資料集，經由它獨特的演算法進行學習文本資料與統整能力，然後在下一次別人向ChatGPT提問類似晶圓製造的方法時，透過「不同文字但類似觀念」的方式輸出或呈現。換句話說，筆者在問 ChatGPT的過程當中，並沒有提及任何浸潤式微影技術所用到的光學領域技術，但在連問兩次的過程中，卻出現利用不同的光學技術去實現浸潤式微影技術。據此，可合理推測當經過研發或科研工作者曾下過的指令或調校之ChatGPT語料庫，那麼在「凡走過必留下痕跡」之下，現有的浸潤式微影技術可能存在這些可據以實施的光學技術。接著再來探討，若面對不太符合請求項的撰寫格式應該怎麼辦？此時如以下圖三所示，可以給予ChatGPT一個可模仿參考的範本。由於範本的內容對ChatGPT來說可能會太長，為避免ChatGPT理解錯誤，此時不妨在範本的上方新增一個「#」標記(tag)，並註明「專利請求項的撰寫格式」，並在對話框的最上面對ChatGPT說明『請模擬以下「專利請求項的撰寫格式」』，最後在對話框的最下面再「#」標記註名「指令」，然後再將圖一的指令再重新貼上。 https://imgur.com/9M0yag3 圖三、給予ChatGPT一個可模仿的範本去學習撰寫專利請求項經過圖三的方式重新再問ChatGPT之後，得出如圖四模仿後的版本。這次不僅回應的版本改進許多，而且更神奇的是，居然在請求項中自行添加「以及」與自動改寫成「如請求項 1所述的…」（如以下圖四中的黃色底線所示），這些撰寫格式上的微小細節馬上被 ChatGPT模仿學到。這些細節上的模仿是筆者在過去實測GPT-4與GPT-3.5時還不曾有的體驗，如今ChatGPT已經進化到連這些小細節都能模仿得微妙微肖。 https://imgur.com/2BrHDEZ 圖四、ChatGPT經模仿後所寫出的版本下一步，筆者繼續要求ChatGPT由方法項改寫成系統項，看看出現甚麼樣的回應，結果如以下圖五所示，也是有模有樣地出現系統項的寫法，雖然尚無法稱得上很到位，但 ChatGPT居然能將方法項自動轉化成系統項的寫法，這對於專利這麼獨特的專業領域來說，已經是很了不起的突破。 https://imgur.com/Bdynbt2 圖五、ChatGPT由方法項改寫成系統項最後，再實測利用圖五的系統項內容，請ChatGPT嘗試用250字寫出實施方式，如以下圖六所示，當下感覺只有讚嘆二字可形容ChatGPT的進化程度。 https://imgur.com/CtDPzl7 圖六、ChatGPT嘗試用250字寫出實施方式姑且先不論ChatGPT的撰寫專利的品質如何，因為即便在人類世界對專利品質的定義和評價標準都還是有點模糊，所以ChatGPT的撰寫品質就不是本文要討論的重點。然而，從多次實測中ChatGPT似乎會根據輸入的技術特徵與功效，在撰寫時會力求上位化，以試圖擴大請求項的發明保護範圍，在此同時，還會搜尋既有的技術資訊，予以適度地限縮請求發明之保護範圍。此外，以上的實測是在今年6月底進行的，再更早之前，筆者也一直在實測GPT-4與 GPT-3.5版應用在專利說明書上的表現，一路實測下來，發現「ChatGPT真的一直有再進化中」，也許下次再寫後續的發展時，可能難以分辨專利說明書究竟是人類寫的，還是 ChatGPT寫的。不過，筆者認同ChatGPT最後給予的提醒：「實際的專利請求項可能需要更詳細的技術資訊，以滿足特異性要求，並由專業的專利律師或專利代理人進行審查和修改」。若專利申請的第一案是中文，接著若需要申請美國，當然就需要進行中翻英，因此筆者順便針對專利翻譯進行實測。同樣地，也給ChatGPT一段包含人設的文字提示，讓ChatGPT擔任一位專利翻譯師，如以下圖七所示，ChatGPT馬上嘗試將提示中的中文翻譯成英文。「I want you to act as an English translator for patent translations. I will provide you with a list of patents that need to be translated into English, and you will provide me with a translation for each patent. You will only need to reply with the translation, and nothing else. My first request is “請將中文專利說明書翻譯成英文”.」為了試探ChatGPT的翻譯水準，筆者刻意用較精深的中文諺語「人心不古，江湖險惡」來測試，結果如以下圖八所示，除了用英文翻譯出之外，還更進一步地解釋這句話的涵義，顯見ChatGPT的翻譯。這時想到很多人常用的Google翻譯，為了要測試Google翻譯能力，筆者也故意用「人心不古，江湖險惡」來考考Google翻譯能力，測試結果整理成表一。顯然Google翻譯是根據字詞上的表面意思硬翻，兩者在翻譯能力上的水準，從表一的結果可窺得一二，不過這當然僅是個例。完成專利說明書的中翻英後，若專利申請人還想翻譯成德文、日文、韓文等其他各國語言，基本上也難不倒ChatGPT，基於表一的測試，推測ChatGPT的表現應該也不俗。筆者建議，若要進行專利說明書的翻譯，還是先經過熟悉中英文技術與專利實務經驗的專利工作者校閱，然後再以英文版的專利說明書為基礎，續行英翻德、英翻日、英翻韓等工作，這樣的做法可提高翻譯的準確度，畢竟ChatGPT的語料庫與相關文本訓練本來就是從英文語料庫開始。二、提供專利撰寫解決方案的工具目前市面上已有應用在專利撰寫和編輯的幾個生成式AI工具，這些解決方案可協助完成專利檢索、分析和申請等任務，並可識別潛在的侵權風險和創新機會，以下茲簡介幾種。 PowerPatent：透過生成式AI技術做專利申請。該平台提供發明揭露流程、發明人與律師間的協作工具，以及帶有請求項生成器(claim generator)和流程圖(flowchart diagramming)的AI專利撰寫工具。該系統還包括專利診斷工具，例如美專利法101專利適格和112可據以實施之明確性分析、先例基礎問題(antecedent basis issues)等功能。 Qatent：係一AI撰寫系統，使用BERT 和以GPT-3為基礎的AI生成技術來撰擬請求項，並能根據請求項自動生成實施例，同時還會給出一些建議。其結合專利代理人知識與大型語言模型，可在直觀界面提供高品質的文本建議。並有一解譯工具(Paraphrasing Tool)，用以建議同一句子的各種選項，為專利申請提供適切範圍，並帶有簡單步驟的圖表生成器。 Specif.io 是為軟體發明而設計的專利撰寫解決方案。使用者提供一組方法發明之軟體，會根據方法請求項自動生成流程圖。嚴格說其雖不是AI工具，但結果可為專利申請提供一框架之使用。 LexisNexis研發之Patent Optimizer：檢查專利說明書是否滿足前述基礎、是否在揭露中發生請求項與實施例之間的支持缺失，以及圖式中是否充分支持以優化專利說明書品質之功能。 PatentPal：建構語言技術以自動生成專利說明書，專利代理人向客戶收取每項專利固定費用，最近開始公測，擬佔領迅速擴大的智財市場。三、以ChatGPT撰擬專利之法律風險（一）輸入ChatGPT任何指令或資料均將被OpenAI使用從以上實測可知，使用ChatGPT大型語言模型撰寫專利請求項初稿，必須先輸入關鍵詞或相關的技術概念及構想，但OpenAI明確表示，就使用者輸入ChatGPT的任何問題、陳述或其他資訊，可被OpenAI審閱或作為訓練的素材。例如，詢問「你會用我的對話進行訓練嗎？」的問題時，它回答：「是的。我們的AI訓練師可能會審查你的對話，以改進我們的系統。」另，OpenAI的FAQ也表明，此類輸入可能會被 OpenAI 使用。例如，在回答「誰可以查看我的對話？」這個問題時，Open AI 回答：「作為對安全和負責任的AI承諾，我們審查對話以改進我們的系統，並確保內容符合我們的政策和安全要求」。（二）輸入ChatGPT指令是否構成公開揭露而使專利無效因此在指令輸入步驟中，會衍生是否可能將自家寶貴的技術思想提供給ChatGPT，而在越來越進階的AI工具撰寫請求項過程中，不可避免會反覆地將漸趨成熟的構思，餵入該資料大熔爐中，因此理論上，將資訊提供給ChatGPT可能是一種揭露，將導致自己的發明構思成為AI工具知識庫的一部分，並可能在某些情況下變成公共領域(public domain)。如從美國專利法的角度看，在請求保護發明的有效申請日之前1年以上向公眾公開[1]，就會衍生是否公開揭露的風險，而可能導致請求保護的發明無效，這都會讓專利申請產生喪失新穎性之不利結果。（參本刊之前報導：以ChatGPT檢索專利可行評估及其法律風險）按ChatGPT是由Open AI所營運的私人機構，基本上對一家公司提供資訊，似乎非針對廣泛可共見共聞之第三人的環境，但ChatGPT本質上就是一個提供全球使用的聊天工具，因此將重要的技術思想輸入，AI工具在吸收你的構想後，哪天在別人詢問時，依ChatGPT的特性，它很可能不自覺地會把這些重要概念吐出去給別人，儘管吐出的資訊和先前輸入的原生技術思想，不見得是一模一樣的文字（參本刊之前報導： AI聊天機器人ChatGPT引爆著作侵權疑雲？-- 文字篇）。因此，雖然只是提供給一家公司，但法律上可能構成公開揭露，而其所生成的文字，即使不是將原生內容原原本本地吐出，仍可能將該重要的構想以其他文字表達出來，故此種輸入將會被視為公開揭露，而導致排除專利保護。在這種情況下，當然也有人會質疑，因為ChatGPT是大家都在用的隨機生成工具，任何人在使用時，其每一次吐出的內容都不太一樣。因此就算可能會有公開揭露的危險，但實務上要怎麼證明也不無疑義。然而，基於凡走過必留下痕跡，如有人在使用工具進行訓練時，將ChatGPT產生出的結果，用到包括錄影、區塊鏈等各種可能的方式存證下來，基於這些風險，要用ChatGPT撰寫專利，就必須格外的謹慎。為降低前述風險，建議可以模糊化關鍵詞描述技術特徵、避免在ChatGPT對話內提及專利申請人全名或簡稱（參本刊之前報導：以ChatGPT檢索專利可行評估及其法律風險），當然，這樣的作法雖可能降低公開揭露的風險，但相對地ChatGPT的撰寫內容可能也很模糊，到頭來還是需要專利業者再予以線下作業進行調整或修正。（三）使用ChatGPT吐出的結果是否可能構成著作侵權再來要探討的是，利用ChatGPT撰寫專利時，使用生成式AI模型所生成的文本，既然是依據有著作權的材料來訓練學習，其是否可能於吐出給使用者的回答中，夾帶或殘留有該原作之部分內容，而造成潛在之著作侵權風險？因ChatGPT本質上，透過網路爬蟲擷取全球公開網路上出現過的資料，是個包括各種內容的資料庫大熔爐，因此利用ChatGPT吐出的結果作為申請專利內容，是否可能用到別人的內容而導致著作侵害？針對此，首先在觀念上，所有專利相關的公開文獻，無論是最後被核准公布的請求項、或專利說明書中的文字和圖式等、或是經18個月早期公開由專利局提供的資料，凡此都是政府機構相關網站公布或公開，依各國著作權法，基本上都是屬於政府資訊而沒有著作權。因此使用這些公開的資料，當然不會有著作權疑義。但ChatGPT吐出的資料，會不會是爬梳到網路上受著作權保護的文本，而可能構成侵害？要澄清的是，即使在網路上有人探討過的內容，其是否適合納入作為請求項的內涵，還要視實際個案而定，但不能否認的，輸入關鍵詞指令或相關描述，讓ChatGPT吐出的內容和其所參考的原生素材，假如構成實質相似，此時就有侵害風險。因ChatGPT係基於概率分布下所進行的文字接龍運作，並非是將網路上的資料copy & paste再吐出，而是經過文字銜接找出最具概率相關的後續文字，因此基本上不會是原原本本地將他人的文字直接予以援用。（參本刊之前報導： AI聊天機器人ChatGPT引爆著作侵權疑雲？-- 文字篇）然而，基於AI 黑盒子屬性或因概率的問題，仍無法完全排除可能產生若干相似的結果（儘管目前來看這種概率不高）。因此，用ChatGPT撰寫專利就必須特別小心，最佳做法當然還是不要全部仰賴AI，而應充分發揮「人機協作」的勤勞運作，從其吐出來的內涵，輔以專利業者的實務經驗，不斷加以改進、增添來優化專利邏輯架構，經過多次的調校反覆做「盡職撰擬」(due diligent drafting)，當然較可能產生脫胎換骨的內容，而遠離可能去踩到別人資料的著作侵權地雷。也就是說，ChatGPT不僅可幫助瞭解既有技術，而且還可能提供撰寫思路，再搭配專利業者過去回覆審查意見或侵權訴訟等實務經驗，方能跳脫出既有的邏輯盲點。迄至目前美國至少有4件指控生成式AI訓練模型之著作侵權訴訟案件[2]，其中一件是開源碼、一件是書籍、二件是圖形影像。（參本刊之前報導： Midjourney與Stability AI擴散模型自動生成引爆著作侵權疑雲？-- 圖形影像篇）基於使用受著作權材料訓練AI模型有侵權疑義，客戶可詢問所使用的訓練數據，並嘗試透過與供應商協議中大規模數位化和文本資料探勘之TDM條款(TDM: Text and data mining)，來限制使用之著作權材料數量。雖然在以上案件中，最終使用者都不是被告的對象，但使用者仍應盡力避免用到侵犯到他人智財權的供應商工具。（四）避免AI無意間成為發明人接下來，利用ChatGPT必須要注意的，依上所述，不能太倚賴ChatGPT所產生的結果，如只是簡單地將由ChatGPT吐出當成專利撰寫之全部內容，而欠缺帶有「人味」之人機協作時，就會衍生另一個專利議題，即大家所熟悉的「發明人屬性」(patent inventorship)。眾所周知，對於完全由AI生成之內容，由Stephen Tyler團隊將其AI機器人DABUS作為發明人，在全球遍地開花廣為申請之下，目前各國專利局的主流見解，基本上都否認AI本身可作為發明人。例如依美國專利法，聯邦巡迴上訴法院於Thaler v. Vidal案判決中即指出，AI不能成為發明人，因為發明人必須是自然人。（參本刊之前報導：美國CAFC就AI可否為專利發明人之爭議譜下終曲樂章） AI本身因為不是人，故不能當發明人，但對於像DABUS這種完全由AI做出來的專利，是否可構成得予專利之標的呢？這方面，以大家最熟悉的著作權來比較，基於完全由AI自動生成的內容，目前在全球各主要國家著作權局的見解，因其欠缺所謂的「著作人格屬性」 (copyright authorship)，只要是AI寫出來的都不准予登記註冊，基本上都否定AI生成內容可作為著作權標的（參本刊之前報導： AI自動生成內容非人類所寫 – 是否可享有著作權？權利保護資格篇）！那麼專利呢？是否也有相同處境？針對此點，基本上目前還沒有比較具體的實務見解，也就是說，AI既然不能作為發明人，但純由AI寫出的東西如沒有人為的介入、而係完全由AI自動生成，是否會影響其可專利性之判斷？基本上，筆者認為，專利和著作具不同的屬性，著作權講究的是必須要有人類之精神創作，但專利基本上是講究技術構思之應用而充滿實作特性，並不講究所謂的人類精神創作，故其「屬物性」會高於「屬人性」，任何工具都可被用來輔佐人類產生得以專利之標的或內涵，因此運用ChatGPT產生全部由AI所得出的結果，理論上似可由人類自己當發明人將其納入申請標的，而得享有專利。惟因這部分目前尚未有實務見解，但美國專利商標局確曾公開指出，「….目前AI機器無法擁有智財權…..」(an AI machine cannot currently own intellectual property rights)，是否隱然暗指由AI自動生成產物也無法獲得專利權（與AI可否當發明人係另一回事）？尚未可知。因此，基於要產生精緻的優質專利，人類仍然必須是盡量透過人機協作反覆優化調校，而不要抓著籃裡就是菜，純粹全倚賴機器經過幾個回合或完全放任由ChatGPT自動生成內容，就冒然提出申請。四、以ChatGPT等生成式AI撰擬專利面臨風險及其對策總之，用ChatGPT或生成式AI撰擬專利會面臨的風險：錯誤的答案：由於ChatGPT目前仍非完美的語言模型，特別是在專利或法律知識方面，所以在撰寫專利時，若完全交由ChatGPT撰寫，有很大的概率將導致對保護發明不準確的邏輯陳述，甚至造成專利無效。不完整或遺漏資訊：ChatGPT的回答常不完整或遺漏關鍵細節，可能影響對專利申請的正確評估。生成答案的局限性：由於目前ChatGPT自動生成的專利說明書，並不如經驗豐富的專利業者，可預期將來得否通過審查意見或侵權判斷的「好球帶」，故完全交由ChatGPT撰寫或將產生品質不佳的專利說明書，可能導致原本是個好的發明，最後卻連答辯申覆的理由都沒有，下場自然是「死當」。洩密風險：由於生成式AI模型，是依既有之語料庫中的知識而自動生成專利說明書，所以其所記載的技術特徵和其功效，如上述自然可能變成生成式AI模型的一個訓練素材，形成洩密風險。根據以上可能的風險，提出以下幾個可行的對策：將ChatGPT安全地安裝在公司內部的私有網絡上，這樣員工的任何查詢，較不會透過網際網路公開流出。這方面的做法可參考近期台積電自行開發的tGenie，不僅可提供如同 ChatGPT的即時對話、翻譯與撰寫報告等功能，還能編寫、除錯程式、預測良率、庫存、價格及銷售等管理，完全針對台積電本身的公司屬性而客製化智能對話系統。至少在客戶、專利事務所與AI服務提供商之間達成「不共享」(no sharing)的資料隱私約定(data privacy agreement)，或要求不對外部或與第三方進行共享等隱私約定。再者，包括ChatGPT等生成式AI專利撰寫和編輯工具，應有一預設或得選擇退出(default or opt out)的條款，以避免被工具內部共享資料用於改進其模型，或甚至是被外部之第三方共享[3]。五、結論總的來說，在使用ChatGPT等生成式AI工具時，應考慮二個層面。第一、資訊保密層面：生成式AI可能涉及處理敏感之專利和客戶資訊等風險，必須確保所使用的系統和平台具有適當的安全措施，以防止資料洩露或未經授權的使用。如可能，應將生成式AI進行個性化，並提供類似雲端運算的合理安全級別，如不對客戶的數據進行交叉訓練，為每個客戶使用單獨的個性化模型。第二、儘管基於GPT-4的ChatGPT具有高達1萬億個參數，理論上能提供更到位的對話或解答，然而因ChatGPT並非完美的語言模型，使用上建議仍遵守「人機協作」的機制，才能真的將ChatGPT發揮作用，畢竟像ChatGPT這樣的工具，應只能定位在輔助人類提升工作效率，而不應完全放任ChatGPT自動生成專利文件，專利文件的品質好壞，可是攸關專利申請人的重大權益，不得不慎。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.145.192.245 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Patent/M.1689056366.A.DFB.html

推 kaikai1112: 有趣 07/11 17:52

推 gofunfull: 很不錯推推 07/11 21:55

推 Steidele: 給推 07/13 05:28