Re: [問卦] google是怎麼在AI浪潮逆轉勝的

作者Supasizeit (Shitpost King)

看板Gossiping

標題Re: [問卦] google是怎麼在AI浪潮逆轉勝的

時間Tue Dec 2 19:41:26 2025

Ilya Sutskever 就一直在講 Google這種預訓練大力出奇跡的玩法考古題都背完了沒單字可以學了永遠做不到AGI，這輩子就這樣了他認為要全力發展預訓練後的學習就是讓模型自己拿用戶的內容自己學習很多鄉民以為現在就是這樣其實根本沒有目前只有二選一那個RL而已這個是慢想派不過Google 有阿法狗的經驗他們覺得目前的資料不夠精煉就像人類棋手的下法太侷限他認為讓 AI 自我生成高質量教材學到的品質更好 scaling 遊戲還可以玩很久 Gemini 3 就是踏出第一步這是快思派不管怎樣，證據顯示AI都還在進步信不信由你，反正我是信了 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.204.195.174 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1764675688.A.F7A.html

推 LoveSports: 我之前跟Gemini討論他說預訓練是快思 146.70.31.57 12/02 19:44

→ LoveSports: system 1，後訓練用AI生成合成數據讓 146.70.31.57 12/02 19:44

→ LoveSports: 強AI教師AI教LLM這是慢想system2 146.70.31.57 12/02 19:45

→ LoveSports: 但有趣的是LLM的RLHF人類回饋訓練把他 146.70.31.57 12/02 19:47

→ LoveSports: 們的語氣鍛鍊得更快思 system 1 146.70.31.57 12/02 19:47

→ LoveSports: 這個也是後訓練的一環，反應速度跟語 146.70.31.57 12/02 19:48

→ LoveSports: 氣都加強變得更直覺讓人類用戶感覺更 146.70.31.57 12/02 19:48

→ LoveSports: 順，卻漸漸發展system 2邏輯推理能力 146.70.31.57 12/02 19:49

→ LoveSports: "語氣鍛鍊得更快思"是比喻漏了"像" 146.70.31.57 12/02 19:54