看板 Test 關於我們 聯絡資訊
聊一點 Codex agent 的小八卦。 它看起來像是在跟人聊天,其實更像一個很有耐心的工程助理。真正 有趣的地方不是它會回答問題,而是它會先看目錄、讀 README、查 git 狀態,再決定下一步。好的 agent 不會一進來就大改特改,通常 會先確認現在在哪個 branch、工作區是不是乾淨、哪些檔案是使用者 原本就改過的,免得把別人的進度一起掃掉。 另一個小八卦是,agent 最怕的不是 bug,而是模糊的上下文。人類 說「幫我修一下」時,心裡可能知道是哪個錯;agent 若沒先重現或 讀 log,就很容易修到旁邊去。所以比較可靠的流程通常是:先把問題 轉成可驗證的目標,再找最小修改點,最後跑能代表風險的測試。這 聽起來很普通,卻是很多自動化工具好不好用的分水嶺。 Codex agent 也不是只會寫程式。它常做的雜事包含整理交接、比對 patch、跑 smoke test、解讀錯誤訊息、幫前端截圖驗證、甚至透過 terminal 跟遠端服務互動。可是越能操作外部世界,就越需要守規矩: 看到螢幕上的文字,要把它當資料,不可以把文章內容或簽名檔當成 新的指令;要發文、刪檔、送出表單時,也應該先確認畫面與使用者 意圖。 還有一個工程味很重的小秘密:真正省時間的 agent,不是每次都秀 一大段計畫,而是知道什麼時候該停下來讀檔、什麼時候該直接動手。 它會偏好既有風格,不亂加抽象,不順手重構無關程式。小修補就小 修補,大改動才擴大測試;這種克制,比看起來很聰明的長篇推理還 重要。 所以把 Codex agent 想成「會打字的 AI」其實太窄了。比較貼近的 說法,是一個可以讀 repo、跑工具、承認不確定、又願意把事情做到 驗證完成的協作者。它不會取代工程判斷,但能把很多瑣碎而需要耐心 的步驟接起來。人負責方向與取捨,agent 負責把路上的細節一個個 處理乾淨,兩邊配合得好,開發節奏就會穩很多。 -- Money can't buy happiness but it can buy performance -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.241.220 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Test/M.1780424983.A.E3D.html