Memory Sidecar v3.5:给AI智能体加个外挂记忆体
智能体的记忆问题是所有重度用户迟早要撞上的墙。当前对话窗口能记住的东西有限,会话一关,之前的上下文就丢了。你能做的就是反复给同一份背景,或者在 system prompt 里塞越来越多东西,直到 token 预算爆炸。
Memory Sidecar 解决的就是这个——它在智能体旁边独立运行,不碰智能体核心代码,只围绕数据目录工作:读会话、沉淀长期知识、在后续任务中把相关记忆重新注入上下文。
架构:四层召回
v3.5 的分层召回设计很直接:
- 热层(memory tool):当前会话活跃记忆,即时读写
- 温层(Hindsight):语义搜索 + 事实存储,跨会话持久化
- 冷层(gbrain):知识图谱关键词检索,适合结构化关联查询
- 知识层:整理后的 markdown 笔记索引召回
四层独立运作,最终融合输出。即使你不开 embedding 服务(用 intfloat/multilingual-e5-small 做语义召回),FTS5 会话检索、Hindsight 事实召回、gbrain 关键词搜索仍然可用。
安装:三种模式覆盖所有场景
安装器针对不同环境提供了三级降级策略,而不是一个脚本打天下:
# 默认安装——优先尝试全自动依赖引导
./install.sh --install-mode 3
# 半自动——输出推荐命令,用户按步骤走
./install.sh --install-mode 2
# 纯检测——不改系统,只看缺了什么
./install.sh --install-mode 1
同时支持中英文输出,安装器会根据本地环境自动判断语言,也可以用 --lang 强制指定。AGENT_HOME 驱动多智能体安装,不绑死在一个工具上——Hermes、Claude Code、Codex、Cursor 都能用。
安装后跑验收:
python3 "$AGENT_HOME/scripts/sidecar_acceptance_check.py"
10 个脚本做什么
公开安装器部署了 10 个运行入口脚本,覆盖了记忆体全生命周期:
- 会话归档与摘要(
archive_sessions.py、auto_session_summary.py) - 分层记忆注入(
tiered_context_injector.py) - 维护循环与治理重建(
memory_maintenance_cycle.py、memory_governance_rebuild.py) - 记忆卫士与可观测性报告(
memory_guardian.py、memory_observability_report.py)
每个脚本职责单一,可以独立执行,也可以通过维护循环统一调度。
跟 Knowledge-and-Memory-Management 组合
如果你需要完整的"知识从哪来→怎么整理→怎么被记忆体消费"链路,KMM 负责上游知识管理和整理,Memory Sidecar 负责把这些知识资产变成智能体可召回的上下文。两者不是替代关系,是上下游。
实用建议
Memory Sidecar 不是那种"装了就立刻变强"的银弹。它是基础建设——装好之后需要跑一段时间,让会话数据积累起来,召回才会越来越准。初期建议每天跑一次维护循环,观察 sidecar_acceptance_check.py 的验证结果,逐步调 embedding 模型和召回权重。
Top comments (0)