推 LoveSports: 我之前跟Gemini討論他說預訓練是快思 146.70.31.57 12/02 19:44
→ LoveSports: system 1,後訓練用AI生成合成數據讓 146.70.31.57 12/02 19:44
→ LoveSports: 強AI教師AI教LLM這是慢想system2 146.70.31.57 12/02 19:45
→ LoveSports: 但有趣的是LLM的RLHF人類回饋訓練把他 146.70.31.57 12/02 19:47
→ LoveSports: 們的語氣鍛鍊得更快思 system 1 146.70.31.57 12/02 19:47
→ LoveSports: 這個也是後訓練的一環,反應速度跟語 146.70.31.57 12/02 19:48
→ LoveSports: 氣都加強變得更直覺讓人類用戶感覺更 146.70.31.57 12/02 19:48
→ LoveSports: 順,卻漸漸發展system 2邏輯推理能力 146.70.31.57 12/02 19:49
→ LoveSports: "語氣鍛鍊得更快思"是比喻 漏了"像" 146.70.31.57 12/02 19:54