推 dream1124: 做得不好是一回事,重點是幹麻叫它吐出暨有的東西? 02/17 09:31
其實這是有原因的,因為llms沒有"world model",所以需要有Source of Truth.
普通來講,是人類,compiler來告訴ai錯誤,然後ai繼續修改。
但如果你要完全agent化,那你需要完整的test suite或者program output來比對。
所以這些論文就只好找現有的專案,有程式output做比對或很完整的test suite。
當然這些就會有暨有程式就在訓練資料裡面的問題。
但就目前看到的,再完整的test suite都不夠,沒有"world model"是llms的x致命傷。
→ dream1124: 若一個花了數萬年的時間翻讀人類經典的服務完全背不出 02/17 09:31
→ dream1124: 暨有的東西,那才算失敗吧?因此生得出來根本就不奇怪 02/17 09:32
→ dream1124: 但如果從使用者立場看,我要它背暨有東西給我幹麻啊? 02/17 09:33
→ dream1124: 要那些東西我直接用最傳統的儲存備援方案就好了啊~ 02/17 09:34
→ dream1124: 要實驗應該做那些從未出現且沒太多相似物可模仿的東西 02/17 09:37
→ dream1124: 到時它無人介入就生得出來又沒有大小問題再來吹也不遲 02/17 09:38
→ hidog: 原本轉貼的那位只是在吹AI,搞不懂他跑來這邊吹幹嘛,去騙 02/17 09:45
→ hidog: 不懂的還行 02/17 09:45
推 WTS2accuracy: 就說這些無腦吹每個言論都菜到不行 拉幫結派找一堆 02/17 12:58
→ WTS2accuracy: 名人言論背書也蓋不過的菜味 AI明明很好用但在這些 02/17 12:58
→ WTS2accuracy: 無腦吹描述後都覺得不香了 哈 02/17 12:58
推 lturtsamuel: 這樣看起來 最適合ai的語言搞不好是純函數式 摒棄內 02/17 13:22
→ lturtsamuel: 部狀態 02/17 13:22
→ lturtsamuel: 反正寫函數式是寫的時候痛苦 維護的時候爽 02/17 13:22
推 yamakazi: 你知道你的大神已經已經開始從不用AI寫扣到變成八成用cl 02/17 13:58
→ yamakazi: aude code嗎 02/17 13:58
推 nckuff: 別人在講AI不能沒有人類維護 你在講八成AI生 02/17 14:29
→ nckuff: 可以滑坡成這樣 蠻厲害的 02/17 14:29
推 dream1124: 八成程式碼都抄前人寫的或軟體產生的很稀罕嗎? 02/17 14:40
→ dream1124: 別講得像你從沒用過生成工具或去StackOverflow抄好嗎? 02/17 14:41
→ dream1124: 根本大驚小怪,一本正經講幹話,笑死人了 02/17 14:43
推 viper9709: 推分享 02/17 16:50
推 Romulus: 怎麼可能是網軍 哪個zz公司會出錢請他 02/17 18:47
※ 編輯: oopFoo (58.114.66.74 臺灣), 02/18/2026 10:27:28
推 dream1124: 原PO 我了解他們選擇叫AI重新造輪子的考量,但這是實驗 02/18 14:29
→ dream1124: 這實驗的方法顯然不夠完善。與其說這在測AI的潛力, 02/18 14:30
→ dream1124: 不如說這是背書考試,測它能否默寫出內容夠長的經典 02/18 14:31