好，我已全面了解 KMM v0.0.2 的真实功能。开始写了。

#ai #automation #opensource

给 AI 智能体装上记忆：Knowledge-and-Memory-Management v0.0.2 实践

每次新会话都是白纸一张。这个问题所有用 AI 智能体的人都会遇到——昨天的调研结论、上周写的分析、上个月踩过的坑，新会话里全得重来。市面上很多方案都绑死在特定智能体上，换个 Agent 就得重配。

Knowledge-and-Memory-Management v0.0.2（以下简称 KMM）走的是另一条路：外挂式记忆层，不碰智能体核心代码。它围绕三个核心能力展开——知识采集、结构化沉淀、跨会话召回。

四路采集引擎

KMM 的 knowledge_collector 模块提供了四路采集管线，从不同来源获取原始知识：

WebCollector：6 种采集引擎，从轻量 HTTP 提取到反检测浏览器（Scrapling + Cloudflare Turnstile 绕过），覆盖 5 级保护策略
VideoCollector：8 种引擎/工具，支持抖音/YouTube/微博等多平台，Whisper ASR 语音转写 + 画面 OCR
ArticleCollector：社交媒体、RSS、长文的内容提取
DocumentCollector：PDF 和图片 OCR 扫描

每路采集器的输出都经过统一的 CollectionResult 结构，传递到下游的笔记生成管线。

采集 → 笔记 → 图谱 → 同步

这是 KMM 最有趣的部分——把原始材料变成可检索的知识资产，中间不依赖任何特定智能体：

采集原始材料 → LLM 结构化提炼 → 写入 Markdown 笔记 → gbrain 知识图谱入库 → 云盘同步

关键在第二步：LLM 从原始材料中提取核心论点、关键数据、时间线和关联阅读，产出结构化 YAML frontmatter + Markdown 正文的笔记文件，存入 $AGENT_HOME/knowledge/notes/。然后自动创建 gbrain 知识图谱节点，建立超链接、标签和时间线，最后通过 rclone 推送到云盘。

RAG 检索：四路并行融合

from notes_rag import NotesRAGManager

manager = NotesRAGManager()
# 跨域检索：本地笔记 + state.db + Hindsight + gbrain 图谱
results = manager.search("分布式系统设计", domains=["personal", "shared"])

NotesRAGManager 的 search 方法通过 ThreadPoolExecutor 并行发起四路查询——本地 Markdown 全文搜索、Hermes state.db FTS5、Hindsight 温层语义检索、gbrain 知识图谱——然后用 RRF（Reciprocal Rank Fusion）算法合并排序。四个来源相互兜底，单一来源不可用时自动降级。

适用场景

这套方案适合谁？如果你同时维护多个 AI 智能体（Hermes + Codex + Claude Code），或者经常需要在会话之间复用知识积累，KMM 的外挂式设计比绑死在一个 Agent 上的记忆系统更灵活。安装时通过 $AGENT_HOME 环境变量切换目标，一套脚本管多个 Agent。

缺点是引入外部依赖：需要 PostgreSQL 16、Hindsight 和 gbrain 三个底层组件，部署复杂度比本地文件方案高一个量级。但换来的是三层召回（热→温→冷）和 RRF 融合的检索质量。

生产环境中建议配 cron 定期运行 memory_maintenance_cycle.py，把归档、索引重建、上下文注入做成无人值守流水线。初次部署后的验收检查用 sidecar_acceptance_check.py 一次跑通。

DEV Community