看板 Marginalman 關於我們 聯絡資訊
http://i.imgur.com/9kPkHy9.jpg 不知道真的假的捏 有那麼強喔 雖然真的蠻強的 不過我覺得主要強在搜尋能力可以跟語言模型搭配很好 我覺得有可能是因為他是google的關係 -- https://i.imgur.com/uxjnOka.jpg https://i.imgur.com/bUtNswO.jpg https://i.imgur.com/jbfOKqp.jpg https://i.imgur.com/mrI9OPz.jpg https://i.imgur.com/PV2Nxix.jpg 小孤獨可愛 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.73.244.232 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Marginalman/M.1763630479.A.5CC.html
Satoman: 程式方面吧,我覺得查資料和gpt5.1差不多 11/20 17:22
Wardyal: 這種自己體會比較準 你的測項跟dataset不一定一樣 11/20 17:23
jeffreyseh: 成本能壓得下來再說吧 現在這幾個model都靠北貴 11/20 17:23
Haruna795682: 好屌 11/20 17:24
Haruna795682: 確實評比本來就比較偏頗 11/20 17:24
emptie: 看了一下,這個的計算基準,人類訂在100% ,做一個task約 11/20 17:25
emptie: 花$17 11/20 17:25
emptie: 所以還……有一段路 11/20 17:25
emptie: 但跟半年前的模型比那是很屌了 11/20 17:25
Haruna795682: 進化很快 11/20 17:28
amsmsk: 進步很快了 11/20 17:29
sustainer123: 數學比較屌 我看別人還在1% 他跳到23% 11/20 17:30
oin1104: 好屌 11/20 17:35
shadow0326: 你這麼信這個評分系統幹什麼呀 11/20 17:40