DEV Community

Manoir Yantai
Manoir Yantai

Posted on

Memory Sidecar v3.5:让 AI 智能体真正记住东西的生产级外挂记忆系统

AI 智能体有个致命缺陷:每次新会话都是白纸一张。你跟它聊了一周的项目背景、代码规范、用户偏好,关掉终端全没了。这不是体验问题,是架构缺陷。

Memory Sidecar 就是为了解决这个而生的。它不修改智能体代码,不引入 Docker 依赖,纯外挂——独立进程,共享数据目录。Hermes、Claude Code、Cursor、Codex,谁用都一样。

架构:三层,没一层是多余的

Agent 写会话 → state.db + 会话文件
         ↓
Sidecar 增量读取,处理新会话
         ↓
  ┌───────────┼───────────┐
  │           │           │
  ▼           ▼           ▼
热层        温层        冷层
(memory     (Hindsight  (gbrain 图谱
 tool,      PostgreSQL)  + FTS5 搜索)
 5KB cap)
         ↓
  分层上下文注入 → 注入到 agent system prompt
Enter fullscreen mode Exit fullscreen mode

热层 — 当前用户画像 + 系统配置。0ms 延迟,5KB 硬上限。放的是"你是谁""正在做什么""别犯的错"这类高频上下文。

温层 — Hindsight 事实图谱(PostgreSQL)。~50ms。自动从每轮会话提取关键事实,按模式聚类。生产环境实际数据:42,481 个节点,21,629 条提取记忆。

冷层 — gbrain 知识图谱 + FTS5 全文搜索。~500ms–2s。10,885 个知识图谱页面,105,601 条可搜索消息。配合 pgvector 做 384 维语义搜索,中文查询也能命中英文内容。

三层结果是 Reciprocal Rank Fusion(RRF)融合后注入 agent 的 system prompt。不是"选一层",是"哪层有货就用哪层,都有就合并排序"。

不是给 Hermes 专供的

AGENT_HOME 环境变量指向哪,Sidecar 就服务哪。v3.5 的安装器支持中英双语交互,--noninteractive 模式适合 CI 批量部署:

git clone https://github.com/mage0535/hermes-memory-installer.git
cd hermes-memory-installer
export AGENT_HOME="$HOME/.claude"
./install.sh --noninteractive
Enter fullscreen mode Exit fullscreen mode

装完跑一次验收:

# sidecar_acceptance_check.py — 生产验证套件(真实脚本节选)
def run_all_checks():
    checks = [
        ("agent_home", AGENT_HOME.exists()),
        ("scripts_dir", SCRIPTS_DIR.exists()),
        ("maintenance_cycle", (SCRIPTS_DIR / "memory_maintenance_cycle.py").exists()),
        ("gbrain_reachable", curl_gbrain_health()),
        ("hindsight_reachable", curl_hindsight_health()),
    ]
    for name, ok in checks:
        print(f"  {name}: {'' if ok else ''}")
    return all(ok for _, ok in checks)
Enter fullscreen mode Exit fullscreen mode

Focused Dossier:不是所有记忆都平等

v3.1 引入的功能,v3.5 已经过生产验证。某些东西——关键人物、长期项目、反复出现的故障——需要特别对待。Dossier 自带别名解析、关键词触发、保留优先级和时间线追踪。第一个投产的 dossier 管理着数百个会话、数千条提取事实、含时间线感知的召回。

加一个新 dossier 只需要在 memory_family_registry.py 里加一条配置,格式自解释。

脏话:干掉过度的中间层

v3.0 有四层,中间挂了一个 agentmemory Docker 桥接层。实际数据只有 13 条过期记录,还多了个 Docker 依赖。v3.1 直接砍了,顺便清理了半成品 memory_index.db

v3.5 在此基础上加了更完善的 embedding 模型选择——6 个模型从 96MB(纯中文轻量)到 2GB(极致精度),不用 embedding 服务也行,FTS5 文本检索本身够用。

生产数据(不是画饼)

截至 v3.5 发布,这套栈在某生产部署上持续运行:

  • 10,885 gbrain 页面
  • 42,481 Hindsight 节点
  • 105,601 条可搜索消息
  • brain score 73(gbrain 内容质量评分)

不是 prototype。是从四月份就跑在生产线上的东西。

适合谁用

你如果:

  • 每天跟 AI 智能体交互 50+ 次
  • 厌倦了反复交代同样的上下文
  • 跑 Hermes、Claude Code 或 Codex 做正经项目
  • 不想改智能体核心代码,也不想上 Docker

那 Memory Sidecar 值得花十分钟装上。项目在 github.com/mage0535/hermes-memory-installer,MIT 协议,中英文双语文档都有。

Top comments (0)