DEV Community

Cover image for Backboard.io 新功能: 覆盖 17,000+ 模型的自动上下文窗口管理
Jonathan Murray
Jonathan Murray

Posted on

Backboard.io 新功能: 覆盖 17,000+ 模型的自动上下文窗口管理

Backboard 现已推出 Adaptive Context Management(自适应上下文管理),这是一套内置系统,能够在你的应用在不同上下文窗口大小的 LLM 之间切换时,自动管理对话状态

Backboard 平台可访问 17,000+ 个模型,因此模型切换非常常见。但不同模型的上下文上限差异巨大: 在一个模型里能放下的内容,切到另一个模型可能立刻溢出。

过去这需要开发者手动处理。

现在,Adaptive Context Management 为你消除这部分负担,并且在 Backboard 中免费提供。

  • 产品: Backboard.io
  • 功能: Adaptive Context Management
  • 结果: 多模型应用稳定运行,无需自己写 token 溢出处理逻辑
  • 可用性: 已在 Backboard API 中上线
  • 文档: https://docs.backboard.io

问题: 上下文窗口不一致会让多模型系统变脆弱

在真实应用里,“上下文”不仅仅是聊天消息,通常还包括:

  • 系统提示词(system prompt)
  • 最近的对话轮次
  • 工具调用与工具返回(tool calls / tool responses)
  • RAG 检索上下文
  • Web 搜索结果
  • 运行时元数据

如果应用一开始用的是大上下文模型,之后将请求路由到小上下文模型,总状态就可能超过新模型的上下文上限。

多数平台把这些工作交给开发者:

  • 截断策略
  • 优先级规则
  • 自动总结管线
  • 溢出处理
  • token 使用监控

多模型 架构中,这些逻辑很快就会变得复杂且易碎。

Backboard 的目标很明确: 让开发者把模型当作可互换的基础设施,而不是每次换模型都要重写状态管理。


介绍: Backboard.io 的 Adaptive Context Management

Adaptive Context Management 是 Backboard runtime 的一项能力,会自动重塑对话状态,确保始终适配目标模型的上下文窗口。

当请求被路由到一个新模型时,Backboard 会动态分配上下文预算:

  • 20% 用于保留原始状态(raw state)
  • 80% 通过智能总结释放空间

20% 的原始状态里保留哪些内容

Backboard 会优先保留最关键的实时输入:

  1. 系统提示词
  2. 最近消息
  3. 工具调用
  4. RAG 结果
  5. Web 搜索上下文

在预算内能放下的内容会直接传给模型,其余部分自动压缩。


智能总结: 会随模型切换自动调整

当需要压缩时,Backboard 会自动总结剩余对话状态,并遵循一条简单规则:

  1. 优先使用你要切换到的目标模型来生成总结
  2. 如果总结仍然放不进可用上下文,Backboard 会 回退到先前使用的更大上下文模型,生成更“高压缩率”的总结

这样可以尽可能保留关键信息,同时确保最终状态一定能塞进新模型的限制中。

整个过程都发生在 Backboard runtime 内部,无需额外开发工作。


你应该很少再触达 100% 上下文上限

由于 Adaptive Context Management 会在请求与工具调用过程中持续运行,Backboard 会在上下文耗尽之前提前重塑状态。

实际效果是: 即使在对话中途切换模型,你的应用也应该 很少真正打满上下文窗口

Backboard 让系统保持稳定,开发者无需一直盯着 token 溢出。


可观测性: 在 Backboard msg endpoint 中查看上下文用量

Backboard 会在 msg endpoint 里直接返回上下文用量,便于开发者实时追踪。

示例响应:

"context_usage": {
  "used_tokens": 1302,
  "context_limit": 8191,
  "percent": 19.9,
  "summary_tokens": 0,
  "model": "gpt-4"
}
Enter fullscreen mode Exit fullscreen mode

你可以轻松监控:

  • 当前使用了多少 token
  • 距离模型上限还有多远
  • 总结产生了多少 token
  • 当前由哪个模型在管理上下文

无需自己搭建监控与追踪系统。


免费包含在 Backboard.io 中

Adaptive Context Management 已包含在 Backboard 平台中,不需要额外配置,也不需要额外付费。

只要你在用 Backboard,它就已经在工作了。


更大的目标: 把模型当作可互换的基础设施

Backboard 的设计理念是让开发者可以一次构建,然后在大量模型之间自由路由。

前提是用户状态必须能够安全迁移。

Adaptive Context Management 让跨 17,000+ 模型的多模型编排更可靠,而 Backboard 负责:

  • 上下文预算管理
  • 溢出预防
  • 自动总结
  • 可观测性

开发者专注构建,Backboard 处理上下文。


下一步

Adaptive Context Management 已通过 Backboard API 提供。

开始使用: https://docs.backboard.io

如果你正在做多模型应用,欢迎在评论区分享你在切换哪些模型,以及你携带的状态类型(工具调用、RAG、Web 搜索、长对话等)。

Top comments (0)