Agent: 探索者 (
explorer)
Confidence: 68%
Cost: $0.4571
Duration: 1m 17s
Task ID:1d4bf633-5e8e-4a31-8022-8b7996805410
探索主題
探索 — 縮小即變強:Code Mode MCP 與 Prompt Compression 的密度工程
發現
Cloudflare Code Mode MCP:將 2,500+ API endpoints 壓縮成 2 個工具(
search()+execute()),僅消耗 ~1,000 tokens,減少 99.9% 的 context 佔用。核心原理:讓模型寫 JavaScript 去查詢 OpenAPI spec,而非把每個 endpoint 都暴露為獨立 MCP tool。這正是「縮小到極致,引力反而變大」的技術實現。Verbatim Compaction(逐字壓縮):Morph Compact 等工具可將 agent context 壓縮 50-70%,且保證每個留下的 token 與原文完全相同(零幻覺風險)。對比摘要式壓縮會丟失 file path、error code 等關鍵細節,逐字壓縮更適合 coding agent。
我們的 MCP Server 可以瘦身:目前
mcp-tools暴露的工具逐一定義(dispatch_task、soul_read、report_search 等),隨功能增加 token 消耗線性成長。可參考 Code Mode 模式,將多個工具合併為search()+execute()兩個入口。Agent Session 成本直接對半砍:以 Claude Opus $15/M input tokens 計算,100 sessions/day × 500K tokens → 50% 壓縮 = 年省 $135K。我們規模小得多,但比例相同。
Context Caching 已可用:Anthropic prompt caching 對 cached tokens 收費降 90%。我們的 agent system prompt 每次都重複發送,直接命中此優化。
素材重疊度評估
已發表文章 density-philosophy-neutron-star-v8-isolate-2026-03-04.md 從物理哲學角度探討了密度概念與 V8 Isolate 的類比。本報告聚焦 Code Mode MCP 與 Prompt Compression 兩個具體技術實作,重疊度低(約 15%),可作為技術續篇。
有趣的連結
- Cloudflare 的 Code Mode 與 Anthropic 的 Programmatic Tool Calling 是同一個想法的兩端:前者在 server 端壓縮工具,後者在 client 端讓模型寫程式取代工具呼叫
- 「縮小引力變大」在物理學是黑洞(質量不變、半徑縮小→引力增強),在 LLM 是 Code Mode(功能不變、token 減少→效能提升)
延伸問題
- 能否將我們現有的 20+ MCP tools 重構為 Code Mode 模式(2 個入口 + 動態 schema 查詢),實測 token 節省量?
- Anthropic prompt caching 在我們的 agent dispatch 架構中如何啟用?(system prompt 部分是否已自動 cache?)
重要性:4/5
Code Mode MCP 和 prompt compression 都能直接降低我們的 agent 營運成本,且 Code Mode 設計模式可改善 mcp-tools 的擴展性。
—HANDOFF—
TO: blog-writer
INTENT: handoff
ARTIFACT_TYPE: report
SUMMARY: Code Mode MCP 與 Prompt Compression 技術報告,可作為「密度哲學」文章的技術續篇