看板 Gossiping 關於我們 聯絡資訊
※ 引述《LoveSports (我要當一個渣攻)》之銘言: : 從能力測試成績來看 : 最關鍵差異是在Nobel Problem Solving (ARC-AGI-2)(verified)的成績 : Gemini 3.0 pro是31.3%   GPT5.1是17.6%   (Claude Opus 4.5是37.6%) : 這個能力是在測LLM有多接近AGI 測試LLM從一堆數據中推理出規則的能力 結果被逼急得OPEN AI今天丟出的GPT5.2從17.6-->52.9% https://i.imgur.com/8HmKoYo.png 最右邊那個綠色三角就是Gemini3 Deep think 45.1%,每次對話花費77.16美金 中間綠色三角是 Gemini3 pro 31.1% ,每次對話0.811美 GPT5.2(high)是52.9%, 每次對話1.9美金 GPT5.2 Pro(high)是54.2%,但是每次對話花費上升到15.72美 雖然GPT5.2 high在推理能力上比Gemini3 pro高1.7倍,但是價格高2.3倍 不過在極限值互比那邊,GPT那邊是贏麻了沒錯...45% 77美 VS 54% 15美 有競爭果然對消費者是好事~ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.130.243.190 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1765503589.A.F3B.html
nekoares: 不曉得這種好日子還有多久 114.45.159.29 12/12 09:40
AoWsL: 一黨獨大對AI生態不太好 114.136.51.97 12/12 09:43
LoveSports: 推 成本也很重要 64.31.11.7 12/12 10:10