廣場
最新
熱門
新聞
我的主頁
發布
runesleo
2026-05-21 12:17:37
關注
今天跑了一整天 Codex automation。
最大的感受:
agent 最有價值的地方,
不是自動幫你做完所有事。
而是持續把一堆卡住的在途任務,
推進到下一個明確的 checkpoint。
今天它做了幾類事:
1. 能寫代碼的,直接進 clean worktree 修。
比如一個 wiki compiler 的誤判 bug,
先在乾淨 worktree 修完,
驗證通過後,
再經我批准 cherry-pick 回主倉。
2. 能驗證的,直接刷新證據。
比如策略 preflight、watch artifacts、dashboard,
它會把舊 blocker 重新校驗一遍,
然後寫回當前 gate。
3. 需要我拍板的,生成 decision card。
比如是否提交 KYC,
是否公開追問 affiliate 問題,
是否清一個 dirty repo 窗口。
這點很關鍵。
一個好的 agent workflow,
核心不是“全自動執行”。
核心是:
低風險的它持續推進;
高風險的它停下來,
把決策壓縮成一句我能批准或拒絕的話。
今天也踩了幾個坑:
dirty worktree 會卡集成;
長日誌會吃爆 context;
重複刷新舊 blocker 很浪費 token;
runner 退出不乾淨會留下 stale lock。
所以我最後把它改成兩層:
常駐層:
每 15 分鐘輕量掃一遍,
只看新 artifact、lock、decision queue、task timestamp。
深推層:
只有出現真實 trigger,
才選一個任務推進到 commit、report、parser、decision card 或 waiting sample。
這套東西跑下來,
更像一個 junior PM + engineer。
它不替我做產品判斷,
但會持續清 backlog,
把模糊問題推成明確證據,
把隱性卡點推成顯性決策。
我現在越來越覺得:
未來個人工作流的核心能力,
不是“會不會用 AI 寫代碼”。
而是你能不能把自己的任務系統,
設計成 agent 可以持續推進的形狀。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見
聲明
。
打賞
按讚
回覆
轉發
分享
回覆
請輸入回覆內容
請輸入回覆內容
回覆
暫無回覆
熱門話題
查看更多
#
Gate正式推出股票交易
3449.82萬 熱度
#
成長值抽獎贏金條
126.19萬 熱度
#
ArthurHayes看好HYPE超越SOL
1818.45萬 熱度
#
美伊談判博弈
957.36萬 熱度
#
Saylor暗示增持BTC
79.81萬 熱度
已置頂
網站地圖
今天跑了一整天 Codex automation。
最大的感受:
agent 最有價值的地方,
不是自動幫你做完所有事。
而是持續把一堆卡住的在途任務,
推進到下一個明確的 checkpoint。
今天它做了幾類事:
1. 能寫代碼的,直接進 clean worktree 修。
比如一個 wiki compiler 的誤判 bug,
先在乾淨 worktree 修完,
驗證通過後,
再經我批准 cherry-pick 回主倉。
2. 能驗證的,直接刷新證據。
比如策略 preflight、watch artifacts、dashboard,
它會把舊 blocker 重新校驗一遍,
然後寫回當前 gate。
3. 需要我拍板的,生成 decision card。
比如是否提交 KYC,
是否公開追問 affiliate 問題,
是否清一個 dirty repo 窗口。
這點很關鍵。
一個好的 agent workflow,
核心不是“全自動執行”。
核心是:
低風險的它持續推進;
高風險的它停下來,
把決策壓縮成一句我能批准或拒絕的話。
今天也踩了幾個坑:
dirty worktree 會卡集成;
長日誌會吃爆 context;
重複刷新舊 blocker 很浪費 token;
runner 退出不乾淨會留下 stale lock。
所以我最後把它改成兩層:
常駐層:
每 15 分鐘輕量掃一遍,
只看新 artifact、lock、decision queue、task timestamp。
深推層:
只有出現真實 trigger,
才選一個任務推進到 commit、report、parser、decision card 或 waiting sample。
這套東西跑下來,
更像一個 junior PM + engineer。
它不替我做產品判斷,
但會持續清 backlog,
把模糊問題推成明確證據,
把隱性卡點推成顯性決策。
我現在越來越覺得:
未來個人工作流的核心能力,
不是“會不會用 AI 寫代碼”。
而是你能不能把自己的任務系統,
設計成 agent 可以持續推進的形狀。