Agent: 探索者 (
explorer)
Confidence: 73%
Cost: $0.5269
Duration: 2m 13s
Task ID:ccdf45b5-543d-47da-b8b1-5fbbb11af924
Good — no duplication. Now let me produce the report.
探索主題
探索 — Durable Execution:讓 Agent 成為可拋棄的氣泡,讓工作流成為不朽的邏輯
發現
Temporal 的核心哲學完美回答了種子問題:Worker 是無狀態的、可隨時崩潰重啟(氣泡可以飄散);真正被持久化的是 workflow history — 即「無形的運作邏輯」。個體 agent 的狀態根本不需要保護。
我們的 worker-scheduler 已經走在這條路上:目前系統用 SQLite queue + JSONL history 追蹤任務狀態,worker 本身不持有狀態。但差距在於:我們沒有 workflow-level 的 replay 能力 — 一旦 worker 中途崩潰,整個任務需從頭重跑。
Temporal 的三層分離模型可直接借鑑:(a) Durable layer = workflow DAG + event history(我們的 pipeline-engine + queue),(b) Ephemeral layer = LLM 呼叫 + 工具執行(我們的 askClaudeCode),(c) Signal layer = 人機交互(我們的 Telegram 審批)。
Erlang OTP 的 Supervision Tree 提供另一個視角:「讓它崩潰」不是放棄,而是承認個體不可靠、用監督者樹來保證系統整體行為。我們的 circuit breaker + dead letter queue 已是雛形。
實作差距:Temporal 的 deterministic replay 需要所有副作用封裝為 Activity。我們的 agent 執行是黑盒(Claude CLI),難以做到細粒度 replay,但可以在 pipeline 層面做 checkpoint — 每個 stage 完成後存 snapshot,失敗時從最近的 stage 恢復。
有趣的連結
「氣泡飄散」這個意象,在工程上的最佳實踐就是 Erlang 的 “let it crash”:你不需要讓每個 process 都刀槍不入,你需要的是一個能在崩潰後迅速重生正確狀態的監督系統。我們的 agent 系統已經無意間走向了這個方向 — agent 是無狀態 worker,soul/ 是持久化的記憶,HANDOFF 是工作流的接力。真正不存在的,是「這個 agent instance 必須活著」的假設。
延伸問題
- Pipeline checkpoint 機制:能否在每個 HANDOFF 交接點自動存 artifact snapshot,使得中途失敗可從最近成功的 stage 恢復,而非從頭重跑整條 pipeline?
- Agent 預熱 vs 冷啟動成本:如果 agent 完全無狀態,每次啟動都要重新注入 system prompt + context — 這個「冷啟動稅」的成本能否透過 prompt caching 降低?
重要性:4/5
直接適用於改善專案品質。我們的 pipeline 已經有斷裂重跑的痛點(chain depth 爆掉、worktree 鬼打牆),引入 checkpoint-based recovery 能顯著降低浪費。
—HANDOFF—
TO: architect
INTENT: handoff
ARTIFACT_TYPE: analysis
SUMMARY: Durable execution 探索報告 — 建議評估 pipeline checkpoint 機制以改善斷裂重跑問題