DEV Community

Manoir Yantai
Manoir Yantai

Posted on

好,我已全面了解 KMM v0.0.2 的真实功能。开始写了。

给 AI 智能体装上记忆:Knowledge-and-Memory-Management v0.0.2 实践

每次新会话都是白纸一张。这个问题所有用 AI 智能体的人都会遇到——昨天的调研结论、上周写的分析、上个月踩过的坑,新会话里全得重来。市面上很多方案都绑死在特定智能体上,换个 Agent 就得重配。

Knowledge-and-Memory-Management v0.0.2(以下简称 KMM)走的是另一条路:外挂式记忆层,不碰智能体核心代码。它围绕三个核心能力展开——知识采集、结构化沉淀、跨会话召回。

四路采集引擎

KMM 的 knowledge_collector 模块提供了四路采集管线,从不同来源获取原始知识:

  • WebCollector:6 种采集引擎,从轻量 HTTP 提取到反检测浏览器(Scrapling + Cloudflare Turnstile 绕过),覆盖 5 级保护策略
  • VideoCollector:8 种引擎/工具,支持抖音/YouTube/微博等多平台,Whisper ASR 语音转写 + 画面 OCR
  • ArticleCollector:社交媒体、RSS、长文的内容提取
  • DocumentCollector:PDF 和图片 OCR 扫描

每路采集器的输出都经过统一的 CollectionResult 结构,传递到下游的笔记生成管线。

采集 → 笔记 → 图谱 → 同步

这是 KMM 最有趣的部分——把原始材料变成可检索的知识资产,中间不依赖任何特定智能体:

采集原始材料 → LLM 结构化提炼 → 写入 Markdown 笔记 → gbrain 知识图谱入库 → 云盘同步
Enter fullscreen mode Exit fullscreen mode

关键在第二步:LLM 从原始材料中提取核心论点、关键数据、时间线和关联阅读,产出结构化 YAML frontmatter + Markdown 正文的笔记文件,存入 $AGENT_HOME/knowledge/notes/。然后自动创建 gbrain 知识图谱节点,建立超链接、标签和时间线,最后通过 rclone 推送到云盘。

RAG 检索:四路并行融合

from notes_rag import NotesRAGManager

manager = NotesRAGManager()
# 跨域检索:本地笔记 + state.db + Hindsight + gbrain 图谱
results = manager.search("分布式系统设计", domains=["personal", "shared"])
Enter fullscreen mode Exit fullscreen mode

NotesRAGManagersearch 方法通过 ThreadPoolExecutor 并行发起四路查询——本地 Markdown 全文搜索、Hermes state.db FTS5、Hindsight 温层语义检索、gbrain 知识图谱——然后用 RRF(Reciprocal Rank Fusion)算法合并排序。四个来源相互兜底,单一来源不可用时自动降级。

适用场景

这套方案适合谁?如果你同时维护多个 AI 智能体(Hermes + Codex + Claude Code),或者经常需要在会话之间复用知识积累,KMM 的外挂式设计比绑死在一个 Agent 上的记忆系统更灵活。安装时通过 $AGENT_HOME 环境变量切换目标,一套脚本管多个 Agent。

缺点是引入外部依赖:需要 PostgreSQL 16、Hindsight 和 gbrain 三个底层组件,部署复杂度比本地文件方案高一个量级。但换来的是三层召回(热→温→冷)和 RRF 融合的检索质量。

生产环境中建议配 cron 定期运行 memory_maintenance_cycle.py,把归档、索引重建、上下文注入做成无人值守流水线。初次部署后的验收检查用 sidecar_acceptance_check.py 一次跑通。

Top comments (0)