→ mantour : AI不斷快速嘗試各種思路,然後可以自己初步排除掉 11/06 14:27
→ mantour : 一些明顯錯誤的,剩下的candidate再給數學家去檢查 11/06 14:27
→ mantour : 。問題是AI提供的解答中黃金:垃圾的比率是否足夠 11/06 14:27
→ mantour : 高,如果垃圾比率太高也是形同浪費數學家檢查的時 11/06 14:27
→ mantour : 間。 11/06 14:27
推 LPH66 : 話說回來, 我看到有一篇論文是他們用 ChatGPT 產生 11/06 20:35
→ LPH66 : 了 Lean 程式碼並且成功編過了, 這種應該算是生成式 11/06 20:36
→ LPH66 : AI 的一種意外應用方式吧 (Lean 程式碼能編過表示 11/06 20:36
→ LPH66 : 邏輯推理是通的) 11/06 20:36
→ LPH66 : 這是那篇論文, 做的是 Erdos 曾經懸賞一千元的猜想 11/06 20:38
推 mantour : 謝謝L大分享的論文 11/06 22:13
推 pmove : LLM靠的還是機率吧,能編過不代表邏輯是通的(回L大 11/07 06:54
→ pmove : ),至於機率是否能產生邏輯,見人見智,但有些人認 11/07 06:54
→ pmove : 為無法,所以AI可能還需要基本架構的革新 11/07 06:54
→ pmove : 編譯過,只代表compile 會過,不代表執行結果正確或 11/07 07:44
→ pmove : 邏輯通 11/07 07:44
推 LPH66 : 那是其他程式語言, 但這篇論文用的是專門用於證明的 11/07 08:50
→ LPH66 : Lean, 就我所知 Lean 程式編過就表示邏輯推論是通的 11/07 08:50
→ LPH66 : 這篇論文的作者有說他們在這之前不會 Lean 11/07 08:52
→ LPH66 : 但經 ChatGPT 的輔助他們能夠將整篇論文的多數結果 11/07 08:54
→ LPH66 : (特別是主要定理) 全部都用 Lean 驗證過 11/07 08:54
推 pmove : 回樓上,受教了,謝謝。 11/07 13:48
→ mantour : LLM很擅長翻譯,把論文的定理轉化成Lean再去檢查推 11/11 07:14
→ mantour : 論是否通過應該辦得到,不過如果使用的數學家本身 11/11 07:14
→ mantour : 也不是很熟悉Lean,有沒有可能在LLM輔助下寫出的Le 11/11 07:14
→ mantour : an跟本來要證的定理其實是不等價的 11/11 07:14
推 LPH66 : 原論文也有討論到這個問題, 但恰巧他們這個問題 11/12 22:58
→ LPH66 : 比較著名 (Erdos 懸賞過的問題) 有其他人已經做好了 11/12 22:59
→ LPH66 : 這種「翻譯」 11/12 22:59
推 ginstein : 創作不易,感謝回文評論! 11/18 09:12