DEV Community

邱敬幃 Pardn Chiu
邱敬幃 Pardn Chiu

Posted on

個人 Agent 助理詳細比較 - OpenClaw / Hermes Agent / Agenvoy

一、架構概覽與定位

Agenvoy OpenClaw Hermes Agent
語言 Go TypeScript Python
Stars 115 373,958 162,833
架構 Daemon + TUI Gateway 單一 Node.js 進程 三層(UI / Core / Execution)
垂直整合 6 個自研套件 依賴第三方 依賴第三方
核心方向 執行可靠性 生態系與易用性 自我改進

三個專案解的是三個不同的問題,不在同一個比較維度上:OpenClaw 讓任何人都能用上強大的 AI agent;Hermes Agent 讓 agent 從使用中學習和進化;Agenvoy 讓每個執行步驟都精確可控。


二、各專案核心優勢

OpenClaw

  • 生態系是護城河:13,729 個社群 skill,ClawHub marketplace,搜尋安裝即用,不需要寫程式,這個規模短期內追不上
  • TypeScript + Node.js 的部署優勢:前端工程師零學習成本,Web 整合直接,serverless 天然契合,npm install 就能跑
  • ContextEngine plugin 架構(v2026.3.7):context 管理策略抽成 plugin interface,社群可以接入自己的 vector store 或壓縮策略,框架不綁定實作
  • 24+ 平台整合:WhatsApp、Teams、iMessage、Signal 這些是個人開發者難以獨立維護的整合點,社群維護讓覆蓋面極廣

Hermes Agent

  • Self-improving 是最有野心的方向:agent 執行中自動創建 skill、下次復用,讓 agent 真正「從經驗學習」,目前沒有其他主流框架做到同樣程度
  • 安全隔離針對多用戶部署:container 硬化、namespace isolation、read-only root filesystem、filesystem checkpoint + rollback、pre-execution scanner——這個 stack 是 SaaS 或多用戶共用伺服器場景的正確答案,隔離的是「不同用戶之間」
  • NousResearch 背景帶來的模型理解:做模型研究的團隊寫 agent 框架,對 context window 行為、model 特性的理解深度不同,ContextCompressor 的策略是研究角度的實作
  • Python 生態pip install 整合任何 ML 庫,資料科學工具鏈天然接入,對 AI/ML 使用者不可替代

Agenvoy

  • 執行引擎的精細度:tool slot 狀態機、session 內 tool 結果快取、三層迴圈防護、tool pair 完整性保護、KV-cache 精確放置
  • 垂直整合:ToriiDB、go-bot、go-scheduler、go-browser 全部自研,無第三方 breaking change 風險,每層 API 邊界自己設計
  • Tool 架構三層分離api_*script_*mcp_* 各有對應的 rate limit、auth、timeout 策略
  • Error memory 閉環:工具失敗 → 向量化記錄 → 語義召回 → hint 注入 tool result
  • Go 的長期運行優勢:低記憶體、真正並發、binary 部署,daemon 長跑無 runtime 管理負擔
  • 安全針對個人與內部部署的威脅模型:OS 沙箱(Linux bwrap / macOS sandbox-exec)三個呼叫點統一入口、命令白名單只允許指定 binary、denied_map.json 封鎖 .ssh/.aws/.gcloud/.env/.pem 等敏感路徑與憑證類型、rm 重導向到 .Trash/ 防止誤刪、run_command 只接受 argv[] 陣列拒絕 shell 字串注入、憑證存 OS keychain 不落 env 檔、localhostOnly() 限制敏感 API 路由、MCP server 預設不信任。這個 stack 防的是「agent 意外做了你不打算讓它做的事」,而不是用戶間隔離。

三、工具生成

Hermes Agent:self-improving 核心。Agent 執行過程中發現重複任務 → 自動生成 skill 檔案(Python)→ 持久化 → 下次復用,不需要人介入。學習連續,agent 使用越久能力越強。

OpenClaw:走社群路線,ClawHub marketplace,13,729 個人工審核過的 skill,品質有一定保證,零程式碼門檻,搜尋安裝即用。

Agenvoyscript-tool-add skill,七個互動關卡:需求釐清 → 命名與參數設計 → dependency 確認 → secret 存取 → 沙箱確認 → 實作 + 測試 → 寫入落地。合約是 stdin JSON → stdout JSON,sandbox 執行。人機協作流程,agent 引導使用者確認每個設計決策後才落地。


四、API / Plugin / Script 工具整合

Hermes Agent:工具是 Python 函數,整合外部 API 直接寫 Python handler,Python 生態所有套件直接可用,ThreadPoolExecutor(8) 並發執行。

OpenClaw:skill 即工具,ClawHub 上大量第三方服務整合已由社群完成,使用者從 marketplace 安裝,不需要自己寫 API handler。ContextEngine plugin 讓開發者可以擴展框架本身。

Agenvoy:MCP 即插即用,OpenClaw 的 skill 生態可以直接透過 MCP server 形式接入——這層相容性不需要額外設定。

在此基礎上,額外提供兩種獨立的工具接口:

api_*    → JSON config 定義 HTTP 端點、auth、參數 schema
           per-API rate limiting(mutex + 1s min gap)

script_* → Python / JS 腳本,sandbox 執行
           stdin JSON → stdout JSON 合約,5min timeout
Enter fullscreen mode Exit fullscreen mode

api_* 讓使用者不寫任何程式碼就能把 REST API 暴露給 agent,script_* 處理需要邏輯運算的情境。三種類型各有獨立 adapter,各自管理自己的 rate limit、auth、timeout 策略,MCP 走 StdioClient(atomic nextID,inflight request 追蹤)。


五、Error Memory

Hermes Agent:MEMORY.md 作為 agent 的知識庫,記錄過去學到的事情包含失敗經驗,高相似度記憶注入 planning prompt。SQLite 持久化跨 session 保留,人工可讀,agent 也可以自己編輯更新。

OpenClaw:ContextEngine plugin 讓開發者自接 vector store,框架不綁定記憶後端。Skill 層面可以包裝記憶邏輯,選擇最適合自己的記憶策略。

Agenvoy:工具失敗時自動記錄到 ToriiDB,分類 error type,90 天 TTL 自動過期。下次相同工具失敗時語義搜尋過去記錄,把 hint 注入 tool result。vectorSearch 失敗時 fallback 到 keywordScan,不中斷主流程。連續失敗超過 MaxRetry 次則 abort 並通知換工具。


六、Context / Summary 管理

Hermes AgentContextCompressor 在 50% context window 時觸發,用獨立的 auxiliary model call 把中間段對話壓縮成摘要,清理孤立 tool pair,對長對話自動縮減,使用者感知不到 context limit。

OpenClaw:v2026.3.7 引入 pluggable ContextEngine,把 context 壓縮策略抽象成 plugin interface,讓開發者換入自己的策略——接 RAG、自訂壓縮演算法、或 semantic chunking 都可以。框架本身不主張哪種最好,交給使用者決定。

Agenvoy:Context 由兩層組成:

[system prompts]
[SummaryMessage]     結構化 JSON,過去討論的長期記憶
[OldHistories]       最近 N 則對話,短期記憶
[UserInput]
[ToolHistories]
Enter fullscreen mode Exit fullscreen mode

summary.json 是一個結構化的 JSON 對象,累積整個 session 的對話摘要——不是壓縮後的文字段落,而是有欄位的記憶(discussion_log、決策、待辦事項等),作為 agent 的長期記憶注入每次請求。OldHistories 則是最近 N 則完整的原始訊息,作為短期記憶。GetSummaryPrompt 在組裝時會依照最舊的 history 時間點過濾掉 discussion_log 裡已被 history 涵蓋的條目,避免重複覆蓋同一段對話。

Summary 的更新走獨立的 cron job,增量游標只處理上次游標之後的新訊息,不重複處理歷史,不需要 auxiliary model call。


七、執行引擎

Hermes AgentThreadPoolExecutor(max_workers=8) 並發執行工具,sequential 或 concurrent 模式可選,有 retry 和 fallback 機制,context compression 在 token 壓力時自動觸發。

OpenClaw:事件驅動 Command Queue,Orchestrator 決定哪個 agent 處理事件、管理任務序列。重點在多 channel 路由和 skill 分派,execution 細節在 skill 層面處理。

Agenvoy

  • 5 狀態 slot 機(Ready / Cached / Skipped / StubActivated / ValidateFailed)
  • IsConcurrent 旗標決定個別工具是否並發,非全部丟 thread pool
  • alreadyCall session 內 tool 結果快取,相同呼叫不重打
  • 三層迴圈防護:MaxToolIterations / MaxEmptyResponses / 同 payload hash retry
  • trimOnContextExceeded 原子刪除 tool pair,保護 message pair 完整性
  • KV-cache ephemeral 放在最後一個 system prompt + 最後一個 tool

八、綜合

維度 Agenvoy OpenClaw Hermes
執行引擎精細度 ★★★★★ ★★★ ★★★★
工具生成彈性 ★★★★ ★★★★★ ★★★★
API/Plugin 工具架構 ★★★★★ ★★★★ ★★★
Error Memory 深度 ★★★★★ ★★★ ★★★★
Context 管理效率 ★★★★★ ★★★★ ★★★★
自我改進能力 ★★★★ ★★★ ★★★★★
生態系規模 ★★ ★★★★★ ★★★★
安全隔離完整度 ★★★★ ★★★ ★★★★★
垂直整合程度 ★★★★★ ★★ ★★★
易用性 / 入門門檻 ★★★ ★★★★★ ★★★★

Top comments (0)