Manoir Yantai

Posted on Jun 20

Memory Sidecar v3.5：让 AI 智能体真正记住东西的生产级外挂记忆系统

#ai #automation #opensource

AI 智能体有个致命缺陷：每次新会话都是白纸一张。你跟它聊了一周的项目背景、代码规范、用户偏好，关掉终端全没了。这不是体验问题，是架构缺陷。

Memory Sidecar 就是为了解决这个而生的。它不修改智能体代码，不引入 Docker 依赖，纯外挂——独立进程，共享数据目录。Hermes、Claude Code、Cursor、Codex，谁用都一样。

架构：三层，没一层是多余的

Agent 写会话 → state.db + 会话文件
         ↓
Sidecar 增量读取，处理新会话
         ↓
  ┌───────────┼───────────┐
  │           │           │
  ▼           ▼           ▼
热层        温层        冷层
(memory     (Hindsight  (gbrain 图谱
 tool,      PostgreSQL)  + FTS5 搜索)
 5KB cap)
         ↓
  分层上下文注入 → 注入到 agent system prompt

热层 — 当前用户画像 + 系统配置。0ms 延迟，5KB 硬上限。放的是"你是谁""正在做什么""别犯的错"这类高频上下文。

温层 — Hindsight 事实图谱（PostgreSQL）。~50ms。自动从每轮会话提取关键事实，按模式聚类。生产环境实际数据：42,481 个节点，21,629 条提取记忆。

冷层 — gbrain 知识图谱 + FTS5 全文搜索。~500ms–2s。10,885 个知识图谱页面，105,601 条可搜索消息。配合 pgvector 做 384 维语义搜索，中文查询也能命中英文内容。

三层结果是 Reciprocal Rank Fusion（RRF）融合后注入 agent 的 system prompt。不是"选一层"，是"哪层有货就用哪层，都有就合并排序"。

不是给 Hermes 专供的

AGENT_HOME 环境变量指向哪，Sidecar 就服务哪。v3.5 的安装器支持中英双语交互，--noninteractive 模式适合 CI 批量部署：

git clone https://github.com/mage0535/hermes-memory-installer.git
cd hermes-memory-installer
export AGENT_HOME="$HOME/.claude"
./install.sh --noninteractive

装完跑一次验收：

# sidecar_acceptance_check.py — 生产验证套件（真实脚本节选）
def run_all_checks():
    checks = [
        ("agent_home", AGENT_HOME.exists()),
        ("scripts_dir", SCRIPTS_DIR.exists()),
        ("maintenance_cycle", (SCRIPTS_DIR / "memory_maintenance_cycle.py").exists()),
        ("gbrain_reachable", curl_gbrain_health()),
        ("hindsight_reachable", curl_hindsight_health()),
    ]
    for name, ok in checks:
        print(f"  {name}: {'✓' if ok else '✗'}")
    return all(ok for _, ok in checks)

Focused Dossier：不是所有记忆都平等

v3.1 引入的功能，v3.5 已经过生产验证。某些东西——关键人物、长期项目、反复出现的故障——需要特别对待。Dossier 自带别名解析、关键词触发、保留优先级和时间线追踪。第一个投产的 dossier 管理着数百个会话、数千条提取事实、含时间线感知的召回。

加一个新 dossier 只需要在 memory_family_registry.py 里加一条配置，格式自解释。

脏话：干掉过度的中间层

v3.0 有四层，中间挂了一个 agentmemory Docker 桥接层。实际数据只有 13 条过期记录，还多了个 Docker 依赖。v3.1 直接砍了，顺便清理了半成品 memory_index.db。

v3.5 在此基础上加了更完善的 embedding 模型选择——6 个模型从 96MB（纯中文轻量）到 2GB（极致精度），不用 embedding 服务也行，FTS5 文本检索本身够用。

生产数据（不是画饼）

截至 v3.5 发布，这套栈在某生产部署上持续运行：

10,885 gbrain 页面
42,481 Hindsight 节点
105,601 条可搜索消息
brain score 73（gbrain 内容质量评分）

不是 prototype。是从四月份就跑在生产线上的东西。

适合谁用

你如果：

每天跟 AI 智能体交互 50+ 次
厌倦了反复交代同样的上下文
跑 Hermes、Claude Code 或 Codex 做正经项目
不想改智能体核心代码，也不想上 Docker

那 Memory Sidecar 值得花十分钟装上。项目在 github.com/mage0535/hermes-memory-installer，MIT 协议，中英文双语文档都有。

DEV Community