[新聞] OpenAI的實驗性模型能力已達國際數學奧

作者KotoriCute (乙醯胺酚)

看板Gossiping

標題[新聞] OpenAI的實驗性模型能力已達國際數學奧

時間Tue Jul 22 00:31:53 2025

備註請放最後面違者新聞文章刪除 1.媒體來源: ※ 例如蘋果日報、自由時報（請參考版規下方的核准媒體名單） ※ Yahoo、MSN、LINE等非直接官方新聞連結不被允許 iThome 2.記者署名: ※ 若新聞沒有記者名字或編輯名字，請勿張貼，否則會被水桶14天 ※ 外電至少要有來源或編輯如:法新社陳曉莉 3.完整新聞標題: ※ 標題沒有完整寫出來 ---> 依照板規刪除文章 OpenAI的實驗性模型能力已達國際數學奧林匹亞金牌選手程度 4.完整新聞內文: ※ 社論特稿都不能貼！違者刪除（政治類水桶3個月)，貼廣告也會被刪除喔！可詳看版規 OpenAI的研究科學家Alexander Wei上周六（7/19）宣布，OpenAI實驗性的推理大型語言模型在世界最負盛名的數學競賽—國際數學奧林匹亞（International Math Olympiad，IMO）取得了金牌等級的成績。Wei在X上展示了一張草苺掛上金牌的照片，外界猜測或許代表其專案名稱為Strawberry。 IMO是一項針對高中生的全球性數學競賽，在兩天的競賽中各提供4.5小時的時間來解決涵蓋不同領域的3道數學題目，每道題最高為7分，金牌門檻每年不一，通常落在31~42分之間，今年數奧甫於上周結束，金牌門檻為35分，有67名同學獲得金牌。OpenAI採用與人類參賽者同樣的規則，不使用工具或網路，讓模型閱讀官方問題的陳述，再以自然語言撰寫證明，它解決了5道題目，得到35分，剛好為今年的金牌門檻。 Google DeepMind的AlphaProof模型也曾在2024年挑戰數奧，它解決了4道題目，得到28分，距去年金牌門檻只有1分之遙。 Wei說，相較於過去的基準測試，IMO需要持續的思考能力，此一結果意味著模型的推理時間範圍，已從只需要0.1分鐘的GSM8K、約1分鐘的MATH、10分鐘的AIME，擴展至可能需要100分鐘的IMO，從簡單的快速運算到處理需要長時間思考的複雜問題，同時媲美人類頂尖數學家。此外，除了結果本身，Wei更對他們所使用的方法感到興奮，因為他們並非透過狹隘、針對特定任務的方法，而是在通用強化學習及推理時擴充運算能力上開創了新局面。不過，該達到數奧金牌等級的大型語言模型仍只是個實驗性的研究模型，並非商業產品，Op enAI短期內、至少在數個月內都不會釋出類似的功能。但外界可以期待的是OpenAI即將發表 GPT-5。該模型很可能是Wei在OpenAI的最後一個作品，因為專注於大型語言模型及推理研究的Wei已於今年7月中跳槽至Meta AI，成為Meta超級智慧實驗室（Meta Superintelligence Labs，M SL）的一員。 5.完整新聞連結 (或短網址)不可用YAHOO、LINE、MSN等轉載媒體: ※ 當新聞連結過長時，需提供短網址方便網友點擊 https://www.ithome.com.tw/news/170164 6.備註: ※ 一個人一天只能張貼一則新聞(以天為單位)，被刪或自刪也算額度內，超貼者水桶，請? ※ 備註請勿張貼三日內新聞(包含連結、標題等) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.38.83.31 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1753115515.A.E02.html

推 qwop5: 台灣缺電不用跟人玩 42.73.171.203 07/22 01:26

→ yunf: 那是因為你們的小腦袋太天真了 101.10.157.170 07/22 02:31

→ yunf: 你蓋一座別人可以蓋100座 101.10.157.170 07/22 02:32

→ yunf: 只要是考量體能贏的都沒有必要去硬拚 101.10.157.170 07/22 02:33

→ yunf: 靠* 101.10.157.170 07/22 02:33

→ yunf: 到時候真的完成他甚至可以把算力中心丟到外 101.10.157.170 07/22 02:35

→ yunf: 太空 101.10.157.170 07/22 02:35

→ yunf: 算完把結果傳回來就好 101.10.157.170 07/22 02:36

→ yunf: 你現在東西會壞是因為他是消費性電子他也可 101.10.157.170 07/22 02:36

→ yunf: 以做一個不會壞的 101.10.157.170 07/22 02:36