DEV Community

erikqin
erikqin

Posted on

Hermes Agent:会自我成长的 AI 智能体

Hermes Agent:会自我成长的 AI 智能体

来源:GitHub - NousResearch/hermes-agent
作者:Nous Research | 许可证:MIT


一、核心观点

Hermes Agent 是由 Nous Research 开发的自我进化型 AI 智能体,其最大亮点在于内置了一个闭环学习机制——它能从经验中自动创建技能、在使用中持续改进、跨会话检索记忆,并逐渐建立对用户的深度认知模型。它不是一个简单的聊天工具,而是一个可以长期陪伴成长、在云端独立运行的个人 AI 助手


二、关键信息

2.1 六大核心能力

能力模块 描述
🖥️ 真实终端界面 完整 TUI,支持多行编辑、斜杠命令自动补全、会话历史、流式工具输出
📱 多平台接入 支持 Telegram、Discord、Slack、WhatsApp、Signal 和 CLI,单一网关进程统一管理;支持语音备忘录转录
🔄 闭环学习系统 自动创建技能、技能自我进化、FTS5 全文检索历史会话、LLM 摘要辅助跨会话回忆、Honcho 用户建模
定时自动化任务 内置 Cron 调度器,支持自然语言描述任务,可投递到任意平台(日报、备份、审计等)
🤖 并行子智能体 可派生隔离子智能体并行执行任务,Python 脚本通过 RPC 调用工具,压缩多步流水线成本
🌐 随处运行 支持 Local / Docker / SSH / Singularity / Modal / Daytona / Vercel Sandbox 七种后端;低至 $5 VPS 即可运行

2.2 学习闭环(Learning Loop)详解

这是 Hermes Agent 区别于其他 Agent 的核心差异点

  • 技能自动创建:完成复杂任务后自主归纳为可复用的「技能」
  • 技能自我优化:每次使用技能时持续改进
  • 主动记忆提醒:定期「推动」自己持久化重要知识
  • 跨会话搜索:FTS5 全文索引历史对话 + LLM 摘要,实现长期记忆检索
  • 用户建模:通过 Honcho 辩证式建模,逐步深化对用户的理解
  • 开放标准兼容:兼容 agentskills.io 开放技能标准

2.3 模型支持(无厂商锁定)

支持通过 hermes model 命令一键切换,无需改动代码:

提供商 说明
Nous Portal 官方推荐入口
OpenRouter 200+ 模型
NVIDIA NIM Nemotron 系列
Xiaomi MiMo 小米大模型平台
z.ai / GLM 智谱 AI
Kimi / Moonshot 月之暗面
MiniMax MiniMax
Hugging Face 开源模型
OpenAI GPT 系列
自定义端点 私有部署

2.4 从 OpenClaw 迁移

对原 OpenClaw 用户提供完整迁移路径,可导入:

  • SOUL.md 人格文件
  • MEMORY.md / USER.md 记忆条目
  • 用户自创技能
  • 命令白名单
  • 各平台配置及 API 密钥
  • TTS 音频资产

三、安装与快速上手

3.1 安装(Linux / macOS / WSL2 / Termux)

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
Enter fullscreen mode Exit fullscreen mode

3.2 Windows(PowerShell,早期 Beta)

irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1 | iex
Enter fullscreen mode Exit fullscreen mode

⚠️ Windows 原生支持为早期 Beta,推荐使用 WSL2 路径更稳定。

3.3 安装后启动

source ~/.bashrc   # 重载 Shell
hermes             # 开始聊天!
Enter fullscreen mode Exit fullscreen mode

3.4 常用命令速查

hermes              # 启动交互式 CLI
hermes model        # 选择 LLM 提供商和模型
hermes tools        # 配置启用的工具
hermes config set   # 设置配置项
hermes gateway      # 启动消息网关(Telegram/Discord 等)
hermes setup        # 运行完整设置向导
hermes update       # 更新到最新版本
hermes doctor       # 诊断问题
hermes claw migrate # 从 OpenClaw 迁移
Enter fullscreen mode Exit fullscreen mode

3.5 对话内斜杠命令(CLI 与消息平台通用)

操作 命令
开启新会话 /new/reset
切换模型 /model [provider:model]
设置人格 /personality [name]
重试 / 撤销 /retry / /undo
压缩上下文 /compress
查看用量 /usage / /insights
浏览技能 /skills
中断当前任务 Ctrl+C(CLI)/ /stop(消息平台)

四、开发者贡献

快速克隆并运行

git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
./setup-hermes.sh   # 自动安装 uv、创建虚拟环境、安装依赖、软链接
./hermes            # 自动检测 venv,无需手动 source
Enter fullscreen mode Exit fullscreen mode

手动安装路径

curl -LsSf https://astral.sh/uv/install.sh | sh
uv venv .venv --python 3.11
source .venv/bin/activate
uv pip install -e ".[all,dev]"
scripts/run_tests.sh
Enter fullscreen mode Exit fullscreen mode

五、个人启发

  1. 「记忆 + 技能」双飞轮是关键设计:大多数 Agent 只有短期上下文,而 Hermes 通过记忆持久化 + 技能自动创建构建了真正的长期积累机制。这让它越用越聪明,而不是每次从零开始。

  2. 无厂商锁定的架构哲学值得借鉴:用 hermes model 一条命令切换 200+ 模型,意味着用户可以随时响应模型能力迭代,不被任何一家厂商绑架。这种设计在个人工具开发中极具参考价值。

  3. Serverless 思路降低了持续运行成本:利用 Modal / Daytona 等无服务器后端,Agent 空闲时休眠、按需唤醒,真正做到"低成本 7×24 小时在线",对个人用户极其友好。

  4. 多平台统一网关是实用性的关键:支持 Telegram / WhatsApp / Signal 等渠道意味着可以随时随地在手机上与 Agent 交互,同时 Agent 在云端异步工作,彻底打破"AI 只在电脑前才能用"的局限。


六、延伸思考

  1. 技能的质量保障问题:Agent 自主创建和优化技能,如何防止「坏习惯」的固化?例如某次任务的错误解法被反复强化,是否需要人工审核或评分机制来介入?

  2. 跨用户技能共享的边界在哪里?:agentskills.io 开放标准意味着技能可以跨用户流通,但每个用户的上下文和需求差异巨大,通用技能与个性化技能如何平衡、如何防止隐私泄露,是值得深入探讨的工程与伦理问题。

  3. 长期用户建模带来的"信息茧房"风险:Hermes 会持续深化对用户的认知模型,这一方面让交互更精准,另一方面也可能导致 Agent 只提供用户"期望听到"的答案,丧失客观性——如何在个性化与多样性之间取得平衡?

Top comments (0)