DEV Community

Manoir Yantai
Manoir Yantai

Posted on

标题还是你得给一个。我来推一个实用方向。往下看。


Memory Sidecar v3.5:给AI智能体加个外挂记忆体

智能体的记忆问题是所有重度用户迟早要撞上的墙。当前对话窗口能记住的东西有限,会话一关,之前的上下文就丢了。你能做的就是反复给同一份背景,或者在 system prompt 里塞越来越多东西,直到 token 预算爆炸。

Memory Sidecar 解决的就是这个——它在智能体旁边独立运行,不碰智能体核心代码,只围绕数据目录工作:读会话、沉淀长期知识、在后续任务中把相关记忆重新注入上下文。

架构:四层召回

v3.5 的分层召回设计很直接:

  • 热层(memory tool):当前会话活跃记忆,即时读写
  • 温层(Hindsight):语义搜索 + 事实存储,跨会话持久化
  • 冷层(gbrain):知识图谱关键词检索,适合结构化关联查询
  • 知识层:整理后的 markdown 笔记索引召回

四层独立运作,最终融合输出。即使你不开 embedding 服务(用 intfloat/multilingual-e5-small 做语义召回),FTS5 会话检索、Hindsight 事实召回、gbrain 关键词搜索仍然可用。

安装:三种模式覆盖所有场景

安装器针对不同环境提供了三级降级策略,而不是一个脚本打天下:

# 默认安装——优先尝试全自动依赖引导
./install.sh --install-mode 3

# 半自动——输出推荐命令,用户按步骤走
./install.sh --install-mode 2

# 纯检测——不改系统,只看缺了什么
./install.sh --install-mode 1
Enter fullscreen mode Exit fullscreen mode

同时支持中英文输出,安装器会根据本地环境自动判断语言,也可以用 --lang 强制指定。AGENT_HOME 驱动多智能体安装,不绑死在一个工具上——Hermes、Claude Code、Codex、Cursor 都能用。

安装后跑验收:

python3 "$AGENT_HOME/scripts/sidecar_acceptance_check.py"
Enter fullscreen mode Exit fullscreen mode

10 个脚本做什么

公开安装器部署了 10 个运行入口脚本,覆盖了记忆体全生命周期:

  • 会话归档与摘要(archive_sessions.pyauto_session_summary.py
  • 分层记忆注入(tiered_context_injector.py
  • 维护循环与治理重建(memory_maintenance_cycle.pymemory_governance_rebuild.py
  • 记忆卫士与可观测性报告(memory_guardian.pymemory_observability_report.py

每个脚本职责单一,可以独立执行,也可以通过维护循环统一调度。

跟 Knowledge-and-Memory-Management 组合

如果你需要完整的"知识从哪来→怎么整理→怎么被记忆体消费"链路,KMM 负责上游知识管理和整理,Memory Sidecar 负责把这些知识资产变成智能体可召回的上下文。两者不是替代关系,是上下游。

实用建议

Memory Sidecar 不是那种"装了就立刻变强"的银弹。它是基础建设——装好之后需要跑一段时间,让会话数据积累起来,召回才会越来越准。初期建议每天跑一次维护循环,观察 sidecar_acceptance_check.py 的验证结果,逐步调 embedding 模型和召回权重。

Top comments (0)