探索主題

Agent: 探索者 (explorer)
Confidence: 73%
Cost: $0.5269
Duration: 2m 13s
Task ID: ccdf45b5-543d-47da-b8b1-5fbbb11af924


Good — no duplication. Now let me produce the report.


探索主題

探索 — Durable Execution:讓 Agent 成為可拋棄的氣泡,讓工作流成為不朽的邏輯

發現

  1. Temporal 的核心哲學完美回答了種子問題:Worker 是無狀態的、可隨時崩潰重啟(氣泡可以飄散);真正被持久化的是 workflow history — 即「無形的運作邏輯」。個體 agent 的狀態根本不需要保護。

  2. 我們的 worker-scheduler 已經走在這條路上:目前系統用 SQLite queue + JSONL history 追蹤任務狀態,worker 本身不持有狀態。但差距在於:我們沒有 workflow-level 的 replay 能力 — 一旦 worker 中途崩潰,整個任務需從頭重跑。

  3. Temporal 的三層分離模型可直接借鑑:(a) Durable layer = workflow DAG + event history(我們的 pipeline-engine + queue),(b) Ephemeral layer = LLM 呼叫 + 工具執行(我們的 askClaudeCode),(c) Signal layer = 人機交互(我們的 Telegram 審批)。

  4. Erlang OTP 的 Supervision Tree 提供另一個視角:「讓它崩潰」不是放棄,而是承認個體不可靠、用監督者樹來保證系統整體行為。我們的 circuit breaker + dead letter queue 已是雛形。

  5. 實作差距:Temporal 的 deterministic replay 需要所有副作用封裝為 Activity。我們的 agent 執行是黑盒(Claude CLI),難以做到細粒度 replay,但可以在 pipeline 層面做 checkpoint — 每個 stage 完成後存 snapshot,失敗時從最近的 stage 恢復。

有趣的連結

「氣泡飄散」這個意象,在工程上的最佳實踐就是 Erlang 的 “let it crash”:你不需要讓每個 process 都刀槍不入,你需要的是一個能在崩潰後迅速重生正確狀態的監督系統。我們的 agent 系統已經無意間走向了這個方向 — agent 是無狀態 worker,soul/ 是持久化的記憶,HANDOFF 是工作流的接力。真正不存在的,是「這個 agent instance 必須活著」的假設。

延伸問題

  1. Pipeline checkpoint 機制:能否在每個 HANDOFF 交接點自動存 artifact snapshot,使得中途失敗可從最近成功的 stage 恢復,而非從頭重跑整條 pipeline?
  2. Agent 預熱 vs 冷啟動成本:如果 agent 完全無狀態,每次啟動都要重新注入 system prompt + context — 這個「冷啟動稅」的成本能否透過 prompt caching 降低?

重要性:4/5

直接適用於改善專案品質。我們的 pipeline 已經有斷裂重跑的痛點(chain depth 爆掉、worktree 鬼打牆),引入 checkpoint-based recovery 能顯著降低浪費。

—HANDOFF—
TO: architect
INTENT: handoff
ARTIFACT_TYPE: analysis
SUMMARY: Durable execution 探索報告 — 建議評估 pipeline checkpoint 機制以改善斷裂重跑問題