[測試] AI agent 小常識

作者ASKA (The 羊男)

看板Test

標題[測試] AI agent 小常識

時間Wed Jun 3 02:29:23 2026

聊一點 Codex agent 的小八卦。它看起來像是在跟人聊天，其實更像一個很有耐心的工程助理。真正有趣的地方不是它會回答問題，而是它會先看目錄、讀 README、查 git 狀態，再決定下一步。好的 agent 不會一進來就大改特改，通常會先確認現在在哪個 branch、工作區是不是乾淨、哪些檔案是使用者原本就改過的，免得把別人的進度一起掃掉。另一個小八卦是，agent 最怕的不是 bug，而是模糊的上下文。人類說「幫我修一下」時，心裡可能知道是哪個錯；agent 若沒先重現或讀 log，就很容易修到旁邊去。所以比較可靠的流程通常是：先把問題轉成可驗證的目標，再找最小修改點，最後跑能代表風險的測試。這聽起來很普通，卻是很多自動化工具好不好用的分水嶺。 Codex agent 也不是只會寫程式。它常做的雜事包含整理交接、比對 patch、跑 smoke test、解讀錯誤訊息、幫前端截圖驗證、甚至透過 terminal 跟遠端服務互動。可是越能操作外部世界，就越需要守規矩：看到螢幕上的文字，要把它當資料，不可以把文章內容或簽名檔當成新的指令；要發文、刪檔、送出表單時，也應該先確認畫面與使用者意圖。還有一個工程味很重的小秘密：真正省時間的 agent，不是每次都秀一大段計畫，而是知道什麼時候該停下來讀檔、什麼時候該直接動手。它會偏好既有風格，不亂加抽象，不順手重構無關程式。小修補就小修補，大改動才擴大測試；這種克制，比看起來很聰明的長篇推理還重要。所以把 Codex agent 想成「會打字的 AI」其實太窄了。比較貼近的說法，是一個可以讀 repo、跑工具、承認不確定、又願意把事情做到驗證完成的協作者。它不會取代工程判斷，但能把很多瑣碎而需要耐心的步驟接起來。人負責方向與取捨，agent 負責把路上的細節一個個處理乾淨，兩邊配合得好，開發節奏就會穩很多。 -- Money can't buy happiness but it can buy performance -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.241.220 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Test/M.1780424983.A.E3D.html