这个视频由 IBM Technology 的 Martin Keen 讲解,主要介绍了 AI 智能体(AI Agent)不可或缺 combat 的四种记忆类型。该内容基于普林斯顿大学研究团队提出的 Coala 框架(Cognitive Architectures for Language Agents,语言智能体认知架构),将人类记忆模型映射到了 AI 系统中 [01:47]。
以下是视频内容的详细拆解:
💡 为什么 AI 需要记忆?
普通聊天机器人(Chatbot)只是被动给出回复,而 AI 智能体(Agent)能利用持久化知识和累积的经验来优化行为、记住偏好并规避过去的错误。记忆,正是区分普通聊天机器人与真正 AI 智能体的关键 [09:54]。
🧠 AI 智能体的四种记忆类型
1. 工作记忆 (Working Memory) — 上下文窗口
- 概念:相当于 AI 的上下文窗口(Context Window) [02:04]。
- 特点:
- 存放当前对话、系统指令(System Instructions)以及当前加载到 Prompt 中的文件或数据 [02:15]。
- 类比 RAM(随机存取内存):速度极快、随时可读取,但具有挥发性(会话结束数据即清空)且容量有上限 [02:27]。
即使目前上下文窗口能扩展到 100 万甚至更多 Token,塞入太多信息仍会导致模型性能下降、丢失中间信息 [02:46]。
现状:这是最基础的记忆,所有聊天机器人和智能体都具备这项能力 [03:09]。
2. 语义记忆 (Semantic Memory) — 知识库
- 概念:存放事实、规则、约定和文档的持久化知识库 [03:24]。
- 实现方式:在学术界常表现为向量数据库(Vector Databases)或知识图谱(Knowledge Graphs),但在实际生产环境中,它往往可以简化为 Markdown(.md)文件 [03:33]。
-
实例:如编程辅助工具 Claude Code,其根目录下的
claude.md记录了项目架构、编码规范、构建命令等。每轮会话开始时,这些静态知识就会被加载进上下文窗口中 [04:04]。 - 作用:告诉智能体它“需要知道什么”,防止其因缺乏持久知识而反复犯相同的错误 [04:27]。
3. 程序记忆 (Procedural Memory) — 技能系统
- 概念:让智能体知道“如何去做”某件事 [04:51]。
-
实现方式:基于开放标准 Agent Skills,通常采用
skill.md文件格式。一个技能文件夹里包含描述其功能的 Markdown 文件和执行该技能的步骤说明(例如:如何做 PPT、如何进行结构化代码审查) [05:00]。 - 核心机制——渐进式披露(Progressive Disclosure):
- 为了不撑爆“工作记忆”(RAM),智能体在初始状态下只加载一个极其轻量级的技能索引(只包含名称和描述,每个技能约占 100 Token) [05:36]。
只有当接收到的任务匹配到该技能时,智能体才会把完整的执行步骤、模板或脚本加载进来 [05:58]。
与语义记忆的区别:语义记忆的知识在上下文中是常驻的;而程序记忆则是按需加载、用完即走 [06:27]。
4. 情节记忆 (Episodic Memory) — 经验与历程
- 概念:记录智能体在过去的交互、决策中所发生的事,以及从中吸取的教训 [06:36]。
- 实现方式:简单的做法是保存所有对话历史并进行检索,但并不高效。优秀的生产系统采用的是蒸馏/压缩经验(Distillation / Compression) [06:45]。
- 例如:相比于保存一个 45 分钟的长代码调试排错日志,智能体只会提炼并记住一句话:“上次调试认证模块时,问题出在中间件层”。 [07:29]
- 难点(工程挑战):这是最难完美实现的记忆类型。AI 很难决定该忘记什么 [07:51]。当某些数据过时或用户更换工作时,旧的项目情节记忆是该保留还是遗忘?人类擅长遗忘,但对 AI 而言,遗忘是一个纯粹的工程难题 [07:59]。
🛠 架构设计:并非所有 Agent 都需要四种记忆
Martin 指出,在实际开发中需要根据智能体的复杂度因地制宜地配置记忆组件 [08:24]:
| 智能体类型 | 场景举例 | 所需记忆组件 |
|---|---|---|
|
反射型/路由智能体 |
(Reflex Agent) | 温控器、基础路由 Bot [08:34] | 仅需 工作记忆(Context Window) [08:41] |
| 窄域单任务智能体
(Narrow Agent) | 密码重置机器人 [08:51] | 工作记忆 + 程序记忆(调用重置技能) [09:08] |
| 复杂全能型智能体
(Advanced Agent) | 编程智能体(Coding Agent) [09:26] | 全部四种记忆(上下文 + 项目静态知识 + 各种工具技能 + 跨会话的纠错和经验积累) [09:35] |
视频在最后提出了一个互动问题:在你自己的智能体工作流(Agentic Workflows)中,你目前正在使用哪几种记忆呢 [10:24]?
Top comments (0)