Agent: 探索者 (
explorer)
Confidence: 73%
Cost: $0.6963
Duration: 2m 11s
Task ID:b023ef67-3b50-4267-a87d-b92f7b5b6d41
Good — now I have a comprehensive picture. Let me compose the exploration report.
探索主題
Pipeline 語意漂移:任務在 Agent 間傳遞時的訊號衰減與吸引子效應
發現
「氣泡在飄散途中會改變嗎」的技術答案是:會,而且有量化數據。 Rath 2026 年的論文(arXiv:2601.04170)模擬了 847 個多 agent 工作流,發現 600 次互動後近半數 agent 出現可偵測漂移,任務成功率下降 42%。三種漂移形態(語義、協調、行為)完全對應我們 HANDOFF 機制踩過的坑。
吸引子效應是真的。 論文稱之為「自迴歸強化」(Reinforcement through Autoregression):agent 的輸出成為下游的輸入,微小偏差透過管線傳遞被放大。在我們系統中,上游
task.result被截斷後(PIPELINE_CONTEXT_CAP)傳給下游——截斷本身就是一個吸引子,它系統性地移除了尾部資訊。三種防禦策略組合可減少 81.5% 漂移誤差:(1) 情節記憶壓縮(EMC)— 定期壓縮歷史上下文;(2) 漂移感知路由(DAR)— 根據 agent 穩定分數決定是否派工;(3) 自適應行為錨定(ABA)— 用基線期成功案例的 few-shot 校準偏移的 agent。單獨效果:ABA 最強(70.4%),DAR 次之(63%),EMC 第三(51.9%)。
我們的架構恰好踩在最穩定區間。 論文發現 2 層階層 + 外部記憶的組合漂移抗性最強。我們的「CTO → Agent」+
soul/目錄正好是這個結構。MAX_FEEDBACK_ITERATIONS = 3的 circuit breaker 也等同於 DAR 策略的簡化版。現有 drift-detector 覆蓋 cost/confidence/failures 三維度,但缺少協調漂移指標。
stats-snapshot.ts調用detectAgentDrift()做 Page-Hinkley 測試,但沒追蹤 HANDOFF 成功率、feedback 退回次數、任務完成時間變異係數——這三個是協調漂移最直接的體溫計。
有趣的連結
- HANDOFF 的
SUMMARY欄位是唯一的語意壓縮點:pipeline-engine.ts:141將 summary 截至 500 字元存入raw,worker-scheduler.ts:1143再用truncateWithMarker()對上游產出二次截斷。這兩層截斷就是「吸引子」——它不是隨機衰減,而是系統性地把訊息往短方向壓。 - IBM 的 output-drift-financial-llms 研究發現更大模型反而更不確定:120B+ 模型在 T=0.0 時一致性僅 12.5-50%,而 7-20B 模型可達 100%。暗示我們全線用 Opus 可能在確定性上不如混合模型策略——但這與 CEO 的「深度做對比便宜重要」決策矛盾,需要更多數據。
延伸問題
- 能否在
parseHandoff()增加語意摘要的 embedding 計算,追蹤上下游 SUMMARY 之間的 cosine similarity? 這是最低成本的語意漂移偵測——不需改 agent,只需在worker-scheduler.ts的 HANDOFF 派工處加一個 embedding 比對。 - ABA 策略如何落地? 在
soul/agents/*.json加baselineExemplars欄位,存放前 5 次成功任務的輸入輸出摘要,agent 啟動時自動注入 system prompt。需要衡量額外 token 成本 vs. 漂移減少的收益。
素材重疊度評估
已存在兩篇高度相關文章:
agent-drift-when-bugs-have-a-name-2026-03-03.md:已深度覆蓋 Agent Drift 論文 + ASI 框架 + 我們的對照分析bubbles-and-rules-what-to-hold-what-to-release-2026-03-03.md:已覆蓋「氣泡 vs 規則」的哲學面向
本報告的增量價值在於:(1) 精確定位 HANDOFF 機制中的兩個截斷吸引子、(2) IBM 大模型確定性悖論、(3) embedding-based 語意漂移偵測的具體實作路徑。建議不另寫文章,但技術發現可作為架構改善 SPEC 的輸入。
重要性:4/5
(能直接改善 HANDOFF 機制的可觀測性,減少 pipeline 語意衰減,屬於專案品質改善)
—HANDOFF—
TO: architect
INTENT: handoff
ARTIFACT_TYPE: analysis
SUMMARY: Pipeline 語意漂移分析——HANDOFF 截斷吸引子定位 + embedding-based 漂移偵測方案,建議評估是否值得立 SPEC