看板 Gossiping 關於我們 聯絡資訊
備註請放最後面 違者新聞文章刪除 1.媒體來源: ※ 例如蘋果日報、自由時報(請參考版規下方的核准媒體名單) ※ Yahoo、MSN、LINE等非直接官方新聞連結不被允許 iThome 2.記者署名: ※ 若新聞沒有記者名字或編輯名字,請勿張貼,否則會被水桶14天 ※ 外電至少要有來源或編輯 如:法新社 陳曉莉 3.完整新聞標題: ※ 標題沒有完整寫出來 ---> 依照板規刪除文章 OpenAI的實驗性模型能力已達國際數學奧林匹亞金牌選手程度 4.完整新聞內文: ※ 社論特稿都不能貼!違者刪除(政治類水桶3個月),貼廣告也會被刪除喔!可詳看版規 OpenAI的研究科學家Alexander Wei上周六(7/19)宣布,OpenAI實驗性的推理大型語言模 型在世界最負盛名的數學競賽—國際數學奧林匹亞(International Math Olympiad,IMO) 取得了金牌等級的成績。Wei在X上展示了一張草苺掛上金牌的照片,外界猜測或許代表其專 案名稱為Strawberry。 IMO是一項針對高中生的全球性數學競賽,在兩天的競賽中各提供4.5小時的時間來解決涵蓋 不同領域的3道數學題目,每道題最高為7分,金牌門檻每年不一,通常落在31~42分之間, 今年數奧甫於上周結束,金牌門檻為35分,有67名同學獲得金牌。OpenAI採用與人類參賽者 同樣的規則,不使用工具或網路,讓模型閱讀官方問題的陳述,再以自然語言撰寫證明,它 解決了5道題目,得到35分,剛好為今年的金牌門檻。 Google DeepMind的AlphaProof模型也曾在2024年挑戰數奧,它解決了4道題目,得到28分, 距去年金牌門檻只有1分之遙。 Wei說,相較於過去的基準測試,IMO需要持續的思考能力,此一結果意味著模型的推理時間 範圍,已從只需要0.1分鐘的GSM8K、約1分鐘的MATH、10分鐘的AIME,擴展至可能需要100分 鐘的IMO,從簡單的快速運算到處理需要長時間思考的複雜問題,同時媲美人類頂尖數學家 。 此外,除了結果本身,Wei更對他們所使用的方法感到興奮,因為他們並非透過狹隘、針對 特定任務的方法,而是在通用強化學習及推理時擴充運算能力上開創了新局面。 不過,該達到數奧金牌等級的大型語言模型仍只是個實驗性的研究模型,並非商業產品,Op enAI短期內、至少在數個月內都不會釋出類似的功能。但外界可以期待的是OpenAI即將發表 GPT-5。 該模型很可能是Wei在OpenAI的最後一個作品,因為專注於大型語言模型及推理研究的Wei已 於今年7月中跳槽至Meta AI,成為Meta超級智慧實驗室(Meta Superintelligence Labs,M SL)的一員。 5.完整新聞連結 (或短網址)不可用YAHOO、LINE、MSN等轉載媒體: ※ 當新聞連結過長時,需提供短網址方便網友點擊 https://www.ithome.com.tw/news/170164 6.備註: ※ 一個人一天只能張貼一則新聞(以天為單位),被刪或自刪也算額度內,超貼者水桶,請? ※ 備註請勿張貼三日內新聞(包含連結、標題等) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.38.83.31 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1753115515.A.E02.html
qwop5: 台灣缺電 不用跟人玩 42.73.171.203 07/22 01:26
yunf: 那是因為你們的小腦袋太天真了 101.10.157.170 07/22 02:31
yunf: 你蓋一座 別人可以蓋100座 101.10.157.170 07/22 02:32
yunf: 只要是考量體能贏的都沒有必要去硬拚 101.10.157.170 07/22 02:33
yunf: 靠* 101.10.157.170 07/22 02:33
yunf: 到時候真的完成 他甚至可以把算力中心丟到外 101.10.157.170 07/22 02:35
yunf: 太空 101.10.157.170 07/22 02:35
yunf: 算完把結果傳回來就好 101.10.157.170 07/22 02:36
yunf: 你現在東西會壞是因為他是消費性電子 他也可 101.10.157.170 07/22 02:36
yunf: 以做一個不會壞的 101.10.157.170 07/22 02:36