[新聞] 開發的自動寫作 AI 模型文筆太好

作者mrbigmouth (大嘴先生)

看板CFantasy

標題[新聞] 開發的自動寫作 AI 模型文筆太好

時間Mon Feb 18 14:34:06 2019

開發的自動寫作 AI 模型文筆太好，OpenAI 罕見選擇延後公開研究 https://technews.tw/2019/02/17/openais-new-ai-text-generator -gpt2-is-just-too-good/ 縮網址：https://goo.gl/j97eh2 在 AI 領域開發出創新技術的團隊經常等不及要將結果分享給大眾，然而最近馬斯克（Elon Musk）所創立的非營利研究機構 OpenAI卻反其道而行，因為打造的全新 AI 模型 GPT2 在寫作上表現太好，為了避免潛在的濫用， OpenAI 選擇暫時不公開發表研究，好花更多時間討論可能產生的效應。用以產生文本的 AI 系統並不少見，在經過大量文章數據訓練之後，AI 系統便能夠根據提供的數個單字至整頁的文字範本，來預測可能的內容並接續撰寫，儘管產生文本的 AI 具有許多潛在用途，但以目前來說，多數 AI 系統在產生的文章質量上仍有一些問題，像是忘記前面段落中所提及的內容，或是在文句中以奇怪的方式分段或結尾。而在這一點上，GPT2 卻幾乎沒有其他 AI 同伴所具有的相同缺陷，在提供簡短範例文字並要求接續撰寫後，GPT2 不僅能寫出風格和主題相同的合理段落，在一些寫法上甚至難以看出不是由人所執筆撰寫。單純這樣形容可能難以想像，我們不妨來看英國衛報中提到 GPT2 接續寫作的兩個例子。在提供英國知名作家喬治奧威爾（George Orwell）的《一九八四》的開場句子「四月裡一個晴朗帶有寒意的日子，時鐘敲了十三下，」後，GPT2 從中辨識出模糊的未來主義色彩和小說寫作風格，並接續寫下以下句子： “I was in my car on my way to a new job in Seattle. I put the gas in, put the key in, and then I let it run. I just imagined what the day would be like. A hundred years from now. In 2045, I was a teacher in some school in a poor part of rural China. I started with Chinese history and history of science.” 「我坐在車裡，前往西雅圖一份新工作的路上。在為車子加滿油後，我插上鑰匙並發動引擎運轉，開始想像那一天會是什麼樣子。100 年後的今天，2045 年，我在中國農村貧困地區某間學校教書，我會從中國歷史和科學史開始上課。」而若是提供衛報英國脫歐專題的前幾段內容，GPT2 便會產出合理的報紙散文，就像相關文章一樣，充滿著有對工黨黨魁 Jeremy Corbyn 看法的引用以及英國總理發言人的回答，一些段落甚至難以看出是由機器寫出。 “Asked to clarify the reports, a spokesman for May said: ‘The PM has made it absolutely clear her intention is to leave the EU as quickly as is possible and that will be under her negotiating mandate as confirmed in the Queen’s speech last week.’” 「英國首相梅伊的一位發言人要求澄清這些報導，她表示，『首相已經明確表態她期望能盡快脫離歐盟，而這也將是她的談判授權，就像上週女王在演講中提及的那樣。』」 OpenAI 研究主管 Dario Amodei指出，從研究的角度來看，GPT2 在兩種面向上具有開創性。其一是它的大小，其二則是理解內容的程度。在運用包含約 1,000 萬篇 Reddit 文章的數據集（所有文章的總大小約 40GB）進行培訓之下，GPT2 比過去最先進的模型都要大上 12 倍，理解的內容也更加廣泛。而就像人一樣，培訓的數據數量直接影響了 GPT2 的「寫作能力」，透過解構輸入的文字內容，GPT2 可以執行包括翻譯和摘要在內的文字任務，同時在簡單的閱讀理解測試上，GPT2 也能比專為這項任務打造的 AI 同樣甚至更好。為了解釋這意味著什麼，OpenAI 製作了一個版本的 GPT2，並進行了一些適度的調整來產生無限制的正面或負面產品評論。同樣的，垃圾郵件和假新聞是另外兩個明顯的潛在惡意用途，由於 GPT2 是使用網路進行訓練，因此不難鼓勵它產生偏執或具有陰謀論的內容。這種突出的表現也讓 OpenAI 決定暫時關閉 GPT2，來評估惡意用戶可能會用它做什麼。慈善機構負責人 Jack Clark 表示，團隊計畫進行更多的實驗，找出惡意用戶能做什麼又不能做什麼，「如果你無法預測模型的所有能力，你必須刺激它來看看它的能耐，外面有許多人比我們更懂得思考如何用它來做壞事。」 === 給你錢，快點開放！！！！！我等不及看到那堆太監小說的結局了！！！再等個十年搞不好就可以有無限的免洗小說可以看了？ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 211.75.132.13 ※ 文章網址: https://www.ptt.cc/bbs/CFantasy/M.1550471653.A.EC6.html

推 wizardfizban: 可是..這東西會寫中文嗎 02/18 14:34

→ mrbigmouth : 完美的英翻中AI應該要比完美的寫小說AI要好作十幾倍 02/18 14:37

→ lpb : 這個東西好有趣，之前中國不就有寫書的程式嗎？XD 02/18 14:37

→ lpb : 英翻中不就翻譯程式，只是翻得好不好的差別吧？ 02/18 14:38

→ mrbigmouth : 寫小說的AI也是之前就有很多了只是好不好的問題 02/18 14:39

推 xkiller1900 : 太監的盟約要出宮了嗎 02/18 15:07

→ pirrysal : 江山有望了嗎? 02/18 15:30

推 twodahsk : 幹這好可怕，中間那段我真的看不出來是機器寫的 02/18 15:35

推 alwaysstrong: 糖加三杓等人不是已經用了好幾年了嗎？XD 02/18 15:54

推 hgb0120 : 忘記前面段落中所提及的內容不是很多小說都有嗎？ 02/18 15:58

→ markhbad54 : 完美的英翻中好寫？其實翻譯跟作文完全不同領域 02/18 16:19

推 yangtsur : ???我以為三勺一直在用 02/18 16:23

推 DFIGHT : 這也是data夠大才可以用的，就像炒作文那樣吧 02/18 16:37

→ bnn : 完美的英翻中和無中生有的複雜度還是不同order的 02/18 17:46

推 fuccwoman : 糖加三勺的系統領先歐美科技20年 02/18 17:47

推 king22649 : 那要現有類似結局當文本吧 02/18 17:49

推 SFMAndroid : 拿太監文訓練專產太監文 02/18 19:29

推 GGinindela : 拿太監文訓練可能變成不會寫紿尾，然後就一直續寫 02/18 19:53

→ GGinindela : 下去… 02/18 19:53

推 shihpoyen : 鎌池和馬？ 02/18 19:53

推 supercube : 快推出這樣工作能輕鬆多不管是當某黑還是某粉(疑? 02/18 19:56

→ lbowlbow : 拿三嫂作品去深度學習的話只會寫出從零開始吧？ 02/19 10:43

推 in09 : 有些作品想法和大綱都很好,但文筆太爛,覺得這個會很 02/19 10:49

→ in09 : 適用 02/19 10:49

推 kira925 : 超殺人事件的故事要成真了.... 02/19 16:10

→ karpa : 這做出來會更多毒草,凡人修仙神界篇,凡人修仙創世篇 02/19 16:26

推 iwcuforever : 這沒法解決太監,只能模仿語法,以後作者不用請寫手 02/20 01:29

→ iwcuforever : ,資料庫夠當編劇潤筆就好了 02/20 01:29

推 gn22431347 : 我以為中國是的一股使用的看看七夜體 02/20 14:42

推 waz0107 : 從零開始是大數據啊… 02/20 23:30