Hermes Agent:会自我成长的 AI 智能体
来源:GitHub - NousResearch/hermes-agent
作者:Nous Research | 许可证:MIT
一、核心观点
Hermes Agent 是由 Nous Research 开发的自我进化型 AI 智能体,其最大亮点在于内置了一个闭环学习机制——它能从经验中自动创建技能、在使用中持续改进、跨会话检索记忆,并逐渐建立对用户的深度认知模型。它不是一个简单的聊天工具,而是一个可以长期陪伴成长、在云端独立运行的个人 AI 助手。
二、关键信息
2.1 六大核心能力
| 能力模块 | 描述 |
|---|---|
| 🖥️ 真实终端界面 | 完整 TUI,支持多行编辑、斜杠命令自动补全、会话历史、流式工具输出 |
| 📱 多平台接入 | 支持 Telegram、Discord、Slack、WhatsApp、Signal 和 CLI,单一网关进程统一管理;支持语音备忘录转录 |
| 🔄 闭环学习系统 | 自动创建技能、技能自我进化、FTS5 全文检索历史会话、LLM 摘要辅助跨会话回忆、Honcho 用户建模 |
| ⏰ 定时自动化任务 | 内置 Cron 调度器,支持自然语言描述任务,可投递到任意平台(日报、备份、审计等) |
| 🤖 并行子智能体 | 可派生隔离子智能体并行执行任务,Python 脚本通过 RPC 调用工具,压缩多步流水线成本 |
| 🌐 随处运行 | 支持 Local / Docker / SSH / Singularity / Modal / Daytona / Vercel Sandbox 七种后端;低至 $5 VPS 即可运行 |
2.2 学习闭环(Learning Loop)详解
这是 Hermes Agent 区别于其他 Agent 的核心差异点:
- 技能自动创建:完成复杂任务后自主归纳为可复用的「技能」
- 技能自我优化:每次使用技能时持续改进
- 主动记忆提醒:定期「推动」自己持久化重要知识
- 跨会话搜索:FTS5 全文索引历史对话 + LLM 摘要,实现长期记忆检索
- 用户建模:通过 Honcho 辩证式建模,逐步深化对用户的理解
- 开放标准兼容:兼容 agentskills.io 开放技能标准
2.3 模型支持(无厂商锁定)
支持通过 hermes model 命令一键切换,无需改动代码:
| 提供商 | 说明 |
|---|---|
| Nous Portal | 官方推荐入口 |
| OpenRouter | 200+ 模型 |
| NVIDIA NIM | Nemotron 系列 |
| Xiaomi MiMo | 小米大模型平台 |
| z.ai / GLM | 智谱 AI |
| Kimi / Moonshot | 月之暗面 |
| MiniMax | MiniMax |
| Hugging Face | 开源模型 |
| OpenAI | GPT 系列 |
| 自定义端点 | 私有部署 |
2.4 从 OpenClaw 迁移
对原 OpenClaw 用户提供完整迁移路径,可导入:
-
SOUL.md人格文件 -
MEMORY.md/USER.md记忆条目 - 用户自创技能
- 命令白名单
- 各平台配置及 API 密钥
- TTS 音频资产
三、安装与快速上手
3.1 安装(Linux / macOS / WSL2 / Termux)
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
3.2 Windows(PowerShell,早期 Beta)
irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1 | iex
⚠️ Windows 原生支持为早期 Beta,推荐使用 WSL2 路径更稳定。
3.3 安装后启动
source ~/.bashrc # 重载 Shell
hermes # 开始聊天!
3.4 常用命令速查
hermes # 启动交互式 CLI
hermes model # 选择 LLM 提供商和模型
hermes tools # 配置启用的工具
hermes config set # 设置配置项
hermes gateway # 启动消息网关(Telegram/Discord 等)
hermes setup # 运行完整设置向导
hermes update # 更新到最新版本
hermes doctor # 诊断问题
hermes claw migrate # 从 OpenClaw 迁移
3.5 对话内斜杠命令(CLI 与消息平台通用)
| 操作 | 命令 |
|---|---|
| 开启新会话 |
/new 或 /reset
|
| 切换模型 | /model [provider:model] |
| 设置人格 | /personality [name] |
| 重试 / 撤销 |
/retry / /undo
|
| 压缩上下文 | /compress |
| 查看用量 |
/usage / /insights
|
| 浏览技能 | /skills |
| 中断当前任务 |
Ctrl+C(CLI)/ /stop(消息平台) |
四、开发者贡献
快速克隆并运行
git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
./setup-hermes.sh # 自动安装 uv、创建虚拟环境、安装依赖、软链接
./hermes # 自动检测 venv,无需手动 source
手动安装路径
curl -LsSf https://astral.sh/uv/install.sh | sh
uv venv .venv --python 3.11
source .venv/bin/activate
uv pip install -e ".[all,dev]"
scripts/run_tests.sh
五、个人启发
「记忆 + 技能」双飞轮是关键设计:大多数 Agent 只有短期上下文,而 Hermes 通过记忆持久化 + 技能自动创建构建了真正的长期积累机制。这让它越用越聪明,而不是每次从零开始。
无厂商锁定的架构哲学值得借鉴:用
hermes model一条命令切换 200+ 模型,意味着用户可以随时响应模型能力迭代,不被任何一家厂商绑架。这种设计在个人工具开发中极具参考价值。Serverless 思路降低了持续运行成本:利用 Modal / Daytona 等无服务器后端,Agent 空闲时休眠、按需唤醒,真正做到"低成本 7×24 小时在线",对个人用户极其友好。
多平台统一网关是实用性的关键:支持 Telegram / WhatsApp / Signal 等渠道意味着可以随时随地在手机上与 Agent 交互,同时 Agent 在云端异步工作,彻底打破"AI 只在电脑前才能用"的局限。
六、延伸思考
技能的质量保障问题:Agent 自主创建和优化技能,如何防止「坏习惯」的固化?例如某次任务的错误解法被反复强化,是否需要人工审核或评分机制来介入?
跨用户技能共享的边界在哪里?:agentskills.io 开放标准意味着技能可以跨用户流通,但每个用户的上下文和需求差异巨大,通用技能与个性化技能如何平衡、如何防止隐私泄露,是值得深入探讨的工程与伦理问题。
长期用户建模带来的"信息茧房"风险:Hermes 会持续深化对用户的认知模型,这一方面让交互更精准,另一方面也可能导致 Agent 只提供用户"期望听到"的答案,丧失客观性——如何在个性化与多样性之间取得平衡?
Top comments (0)