一、架構概覽與定位
| Agenvoy | OpenClaw | Hermes Agent | |
|---|---|---|---|
| 語言 | Go | TypeScript | Python |
| Stars | 115 | 373,958 | 162,833 |
| 架構 | Daemon + TUI | Gateway 單一 Node.js 進程 | 三層(UI / Core / Execution) |
| 垂直整合 | 6 個自研套件 | 依賴第三方 | 依賴第三方 |
| 核心方向 | 執行可靠性 | 生態系與易用性 | 自我改進 |
三個專案解的是三個不同的問題,不在同一個比較維度上:OpenClaw 讓任何人都能用上強大的 AI agent;Hermes Agent 讓 agent 從使用中學習和進化;Agenvoy 讓每個執行步驟都精確可控。
二、各專案核心優勢
OpenClaw
- 生態系是護城河:13,729 個社群 skill,ClawHub marketplace,搜尋安裝即用,不需要寫程式,這個規模短期內追不上
-
TypeScript + Node.js 的部署優勢:前端工程師零學習成本,Web 整合直接,serverless 天然契合,
npm install就能跑 - ContextEngine plugin 架構(v2026.3.7):context 管理策略抽成 plugin interface,社群可以接入自己的 vector store 或壓縮策略,框架不綁定實作
- 24+ 平台整合:WhatsApp、Teams、iMessage、Signal 這些是個人開發者難以獨立維護的整合點,社群維護讓覆蓋面極廣
Hermes Agent
- Self-improving 是最有野心的方向:agent 執行中自動創建 skill、下次復用,讓 agent 真正「從經驗學習」,目前沒有其他主流框架做到同樣程度
- 安全隔離針對多用戶部署:container 硬化、namespace isolation、read-only root filesystem、filesystem checkpoint + rollback、pre-execution scanner——這個 stack 是 SaaS 或多用戶共用伺服器場景的正確答案,隔離的是「不同用戶之間」
- NousResearch 背景帶來的模型理解:做模型研究的團隊寫 agent 框架,對 context window 行為、model 特性的理解深度不同,ContextCompressor 的策略是研究角度的實作
-
Python 生態:
pip install整合任何 ML 庫,資料科學工具鏈天然接入,對 AI/ML 使用者不可替代
Agenvoy
- 執行引擎的精細度:tool slot 狀態機、session 內 tool 結果快取、三層迴圈防護、tool pair 完整性保護、KV-cache 精確放置
- 垂直整合:ToriiDB、go-bot、go-scheduler、go-browser 全部自研,無第三方 breaking change 風險,每層 API 邊界自己設計
-
Tool 架構三層分離:
api_*、script_*、mcp_*各有對應的 rate limit、auth、timeout 策略 - Error memory 閉環:工具失敗 → 向量化記錄 → 語義召回 → hint 注入 tool result
- Go 的長期運行優勢:低記憶體、真正並發、binary 部署,daemon 長跑無 runtime 管理負擔
-
安全針對個人與內部部署的威脅模型:OS 沙箱(Linux
bwrap/ macOSsandbox-exec)三個呼叫點統一入口、命令白名單只允許指定 binary、denied_map.json封鎖.ssh/.aws/.gcloud/.env/.pem等敏感路徑與憑證類型、rm重導向到.Trash/防止誤刪、run_command只接受argv[]陣列拒絕 shell 字串注入、憑證存 OS keychain 不落 env 檔、localhostOnly()限制敏感 API 路由、MCP server 預設不信任。這個 stack 防的是「agent 意外做了你不打算讓它做的事」,而不是用戶間隔離。
三、工具生成
Hermes Agent:self-improving 核心。Agent 執行過程中發現重複任務 → 自動生成 skill 檔案(Python)→ 持久化 → 下次復用,不需要人介入。學習連續,agent 使用越久能力越強。
OpenClaw:走社群路線,ClawHub marketplace,13,729 個人工審核過的 skill,品質有一定保證,零程式碼門檻,搜尋安裝即用。
Agenvoy:script-tool-add skill,七個互動關卡:需求釐清 → 命名與參數設計 → dependency 確認 → secret 存取 → 沙箱確認 → 實作 + 測試 → 寫入落地。合約是 stdin JSON → stdout JSON,sandbox 執行。人機協作流程,agent 引導使用者確認每個設計決策後才落地。
四、API / Plugin / Script 工具整合
Hermes Agent:工具是 Python 函數,整合外部 API 直接寫 Python handler,Python 生態所有套件直接可用,ThreadPoolExecutor(8) 並發執行。
OpenClaw:skill 即工具,ClawHub 上大量第三方服務整合已由社群完成,使用者從 marketplace 安裝,不需要自己寫 API handler。ContextEngine plugin 讓開發者可以擴展框架本身。
Agenvoy:MCP 即插即用,OpenClaw 的 skill 生態可以直接透過 MCP server 形式接入——這層相容性不需要額外設定。
在此基礎上,額外提供兩種獨立的工具接口:
api_* → JSON config 定義 HTTP 端點、auth、參數 schema
per-API rate limiting(mutex + 1s min gap)
script_* → Python / JS 腳本,sandbox 執行
stdin JSON → stdout JSON 合約,5min timeout
api_* 讓使用者不寫任何程式碼就能把 REST API 暴露給 agent,script_* 處理需要邏輯運算的情境。三種類型各有獨立 adapter,各自管理自己的 rate limit、auth、timeout 策略,MCP 走 StdioClient(atomic nextID,inflight request 追蹤)。
五、Error Memory
Hermes Agent:MEMORY.md 作為 agent 的知識庫,記錄過去學到的事情包含失敗經驗,高相似度記憶注入 planning prompt。SQLite 持久化跨 session 保留,人工可讀,agent 也可以自己編輯更新。
OpenClaw:ContextEngine plugin 讓開發者自接 vector store,框架不綁定記憶後端。Skill 層面可以包裝記憶邏輯,選擇最適合自己的記憶策略。
Agenvoy:工具失敗時自動記錄到 ToriiDB,分類 error type,90 天 TTL 自動過期。下次相同工具失敗時語義搜尋過去記錄,把 hint 注入 tool result。vectorSearch 失敗時 fallback 到 keywordScan,不中斷主流程。連續失敗超過 MaxRetry 次則 abort 並通知換工具。
六、Context / Summary 管理
Hermes Agent:ContextCompressor 在 50% context window 時觸發,用獨立的 auxiliary model call 把中間段對話壓縮成摘要,清理孤立 tool pair,對長對話自動縮減,使用者感知不到 context limit。
OpenClaw:v2026.3.7 引入 pluggable ContextEngine,把 context 壓縮策略抽象成 plugin interface,讓開發者換入自己的策略——接 RAG、自訂壓縮演算法、或 semantic chunking 都可以。框架本身不主張哪種最好,交給使用者決定。
Agenvoy:Context 由兩層組成:
[system prompts]
[SummaryMessage] ← 結構化 JSON,過去討論的長期記憶
[OldHistories] ← 最近 N 則對話,短期記憶
[UserInput]
[ToolHistories]
summary.json 是一個結構化的 JSON 對象,累積整個 session 的對話摘要——不是壓縮後的文字段落,而是有欄位的記憶(discussion_log、決策、待辦事項等),作為 agent 的長期記憶注入每次請求。OldHistories 則是最近 N 則完整的原始訊息,作為短期記憶。GetSummaryPrompt 在組裝時會依照最舊的 history 時間點過濾掉 discussion_log 裡已被 history 涵蓋的條目,避免重複覆蓋同一段對話。
Summary 的更新走獨立的 cron job,增量游標只處理上次游標之後的新訊息,不重複處理歷史,不需要 auxiliary model call。
七、執行引擎
Hermes Agent:ThreadPoolExecutor(max_workers=8) 並發執行工具,sequential 或 concurrent 模式可選,有 retry 和 fallback 機制,context compression 在 token 壓力時自動觸發。
OpenClaw:事件驅動 Command Queue,Orchestrator 決定哪個 agent 處理事件、管理任務序列。重點在多 channel 路由和 skill 分派,execution 細節在 skill 層面處理。
Agenvoy:
- 5 狀態 slot 機(Ready / Cached / Skipped / StubActivated / ValidateFailed)
-
IsConcurrent旗標決定個別工具是否並發,非全部丟 thread pool -
alreadyCallsession 內 tool 結果快取,相同呼叫不重打 - 三層迴圈防護:
MaxToolIterations/MaxEmptyResponses/ 同 payload hash retry -
trimOnContextExceeded原子刪除 tool pair,保護 message pair 完整性 - KV-cache
ephemeral放在最後一個 system prompt + 最後一個 tool
八、綜合
| 維度 | Agenvoy | OpenClaw | Hermes |
|---|---|---|---|
| 執行引擎精細度 | ★★★★★ | ★★★ | ★★★★ |
| 工具生成彈性 | ★★★★ | ★★★★★ | ★★★★ |
| API/Plugin 工具架構 | ★★★★★ | ★★★★ | ★★★ |
| Error Memory 深度 | ★★★★★ | ★★★ | ★★★★ |
| Context 管理效率 | ★★★★★ | ★★★★ | ★★★★ |
| 自我改進能力 | ★★★★ | ★★★ | ★★★★★ |
| 生態系規模 | ★★ | ★★★★★ | ★★★★ |
| 安全隔離完整度 | ★★★★ | ★★★ | ★★★★★ |
| 垂直整合程度 | ★★★★★ | ★★ | ★★★ |
| 易用性 / 入門門檻 | ★★★ | ★★★★★ | ★★★★ |
Top comments (0)