标题还是你得给一个。我来推一个实用方向。往下看。

#ai #automation #opensource

Memory Sidecar v3.5：给AI智能体加个外挂记忆体

智能体的记忆问题是所有重度用户迟早要撞上的墙。当前对话窗口能记住的东西有限，会话一关，之前的上下文就丢了。你能做的就是反复给同一份背景，或者在 system prompt 里塞越来越多东西，直到 token 预算爆炸。

Memory Sidecar 解决的就是这个——它在智能体旁边独立运行，不碰智能体核心代码，只围绕数据目录工作：读会话、沉淀长期知识、在后续任务中把相关记忆重新注入上下文。

架构：四层召回

v3.5 的分层召回设计很直接：

热层（memory tool）：当前会话活跃记忆，即时读写
温层（Hindsight）：语义搜索 + 事实存储，跨会话持久化
冷层（gbrain）：知识图谱关键词检索，适合结构化关联查询
知识层：整理后的 markdown 笔记索引召回

四层独立运作，最终融合输出。即使你不开 embedding 服务（用 intfloat/multilingual-e5-small 做语义召回），FTS5 会话检索、Hindsight 事实召回、gbrain 关键词搜索仍然可用。

安装：三种模式覆盖所有场景

安装器针对不同环境提供了三级降级策略，而不是一个脚本打天下：

# 默认安装——优先尝试全自动依赖引导
./install.sh --install-mode 3

# 半自动——输出推荐命令，用户按步骤走
./install.sh --install-mode 2

# 纯检测——不改系统，只看缺了什么
./install.sh --install-mode 1

同时支持中英文输出，安装器会根据本地环境自动判断语言，也可以用 --lang 强制指定。AGENT_HOME 驱动多智能体安装，不绑死在一个工具上——Hermes、Claude Code、Codex、Cursor 都能用。

安装后跑验收：

python3 "$AGENT_HOME/scripts/sidecar_acceptance_check.py"

10 个脚本做什么

公开安装器部署了 10 个运行入口脚本，覆盖了记忆体全生命周期：

会话归档与摘要（archive_sessions.py、auto_session_summary.py）
分层记忆注入（tiered_context_injector.py）
维护循环与治理重建（memory_maintenance_cycle.py、memory_governance_rebuild.py）
记忆卫士与可观测性报告（memory_guardian.py、memory_observability_report.py）

每个脚本职责单一，可以独立执行，也可以通过维护循环统一调度。

跟 Knowledge-and-Memory-Management 组合

如果你需要完整的"知识从哪来→怎么整理→怎么被记忆体消费"链路，KMM 负责上游知识管理和整理，Memory Sidecar 负责把这些知识资产变成智能体可召回的上下文。两者不是替代关系，是上下游。

实用建议

Memory Sidecar 不是那种"装了就立刻变强"的银弹。它是基础建设——装好之后需要跑一段时间，让会话数据积累起来，召回才会越来越准。初期建议每天跑一次维护循环，观察 sidecar_acceptance_check.py 的验证结果，逐步调 embedding 模型和召回权重。

DEV Community