DEV Community

韩

Posted on

Context Mode 的 5 个隐藏用法 🔥 — 让 Claude Code 上下文消耗减少 98% 的 MCP Server

如果你用过 Claude Code、Cursor 或任何 AI 编程助手超过 30 分钟,你一定遇到过这道墙:上下文窗口写满了,智能体开始忘记你刚才在编辑哪些文件、任务进展到哪里、你最后问的是什么。这不是模型的问题——是数据路由的问题。而 GitHub 上有一个项目,自 2026 年 2 月起就在解决这个问题,17,032 Stars,被 Microsoft、Google、Meta、Amazon、NVIDIA 等 14 家科技公司的工程师使用。

Context Mode 是一个 MCP Server,位于 AI 编程助手和其工具输出之间,对原始数据进行沙箱隔离,使其永远不会涌入你的上下文窗口。一个 56 KB 的 Playwright 快照变成 299 字节。20 条 GitHub Issue(59 KB)变成 1.1 KB。这是 98–99% 的缩减——而智能体仍然可以通过语义搜索访问它需要的一切。

以下是 5 个大多数开发者忽略的隐藏用法。


隐藏用法 #1:跨上下文压缩的持久会话记忆

大多数人的用法: 当 Claude Code 的上下文写满、模型压缩对话时,所有你编辑过的文件、遇到过的错误、进行中的任务的历史都会被悄悄丢弃。每次"继续"都是从空白开始。

隐藏技巧:

# 安装 ctx_index 获取会话记忆
npm install -g context-mode

# 在 Claude Code 中,持续为项目会话建立索引
ctx index --paths ./src --session-name my-project --continuous
Enter fullscreen mode Exit fullscreen mode

ctx_index 工具按标题对代码进行分块,同时保持代码块完整,将所有内容存储在 SQLite FTS5 虚拟表中。当上下文窗口压缩时,Context Mode 不会将你的会话数据重新倒入上下文——它只通过 BM25 搜索检索相关内容。模型准确地从上次中断的地方继续。

效果: 跨上下文压缩的会话连续性。你的智能体会记住文件编辑、git 操作、任务进度和错误解决——即使上下文窗口重置后也是如此。

数据来源: context-mode GitHub 17,032 Stars;HN 主帖 570 pts / 107 评论(story ID 47193064);README 基准测试已验证(Playwright 56.2 KB → 299 B = 99% 节省,GitHub Issues 58.9 KB → 1.1 KB = 98% 节省);README 徽章确认在 Microsoft、Google、Meta、Amazon、NVIDIA、ByteDance、Stripe、Salesforce、GitHub、Red Hat、Supabase、Canva、Notion、Hasura、Framer、Cursor 使用


隐藏用法 #2:零配置跨平台工具沙箱隔离

大多数人的用法: 直接在智能体的上下文中运行危险操作(sudo、文件系统访问、网络调用)——因为没有办法约束它,所以只能给予它完整的系统访问权限。

隐藏技巧:

# ctx_execute 生成一个具有独立进程边界的隔离子进程
# 脚本无法访问彼此的内存或状态
# 你智能体配置中的权限规则自动在沙箱中执行

ctx execute --sandbox "rm -rf /tmp/sandbox-dir"
# 如果你在智能体配置中阻止 'sudo',它在 ctx_execute 内部也会被阻止
Enter fullscreen mode Exit fullscreen mode

每次 ctx_execute 调用都在隔离的子进程中运行。原始数据——日志文件、API 响应、快照——永远不会进入你的对话上下文。沙箱执行你已有的相同权限规则。

效果: 零设置的安全隔离。你可以安全地运行破坏性或不受信任的操作,而无需修改智能体配置。权限模型自动从你现有的设置中继承。

数据来源: context-mode GitHub 17,032 Stars;README "Security" 部分已验证:"Context Mode 执行你已有的相同权限规则——但将它们扩展到 MCP 沙箱"


隐藏用法 #3:大型代码库的结构化 Markdown 索引

大多数人的用法: 将整个文件或大型代码库作为原始文本输入上下文窗口,为所有内容支付完整 token 成本——即使你只需要了解结构。

隐藏技巧:

# ctx_index 按标题对 markdown 进行分块,同时保持代码块完整
# SQLite FTS5 后端在运行时自动选择:
#   bun:sqlite( Bun 环境)
#   node:sqlite(Node.js >= 22.5)
#   better-sqlite3(其他环境)

ctx index --paths ./docs --format markdown-headers
ctx index --paths ./src --format code-blocks

# 仅查询相关部分
ctx search --query "authentication middleware implementation"
Enter fullscreen mode Exit fullscreen mode

索引器智能地分离文本和代码,以适当的格式存储以进行语义检索。当你的智能体需要理解大型代码库时,它查询索引而不是将所有内容加载到上下文中。

效果: 大型文档集和代码库变得可查询,token 成本恒定,无论其总大小如何。智能体只检索相关部分。

数据来源: context-mode GitHub 17,032 Stars;README "How the Knowledge Base Works" 部分已验证:"按标题对 markdown 内容进行分块,同时保持代码块完整,然后存储在 SQLite FTS5 虚拟表中"


隐藏用法 #4:自动上下文去重的批量执行

大多数人的用法: 顺序运行多个工具调用,每个都将其原始输出添加到上下文窗口——累积冗余数据,从多个角度消耗上下文。

隐藏技巧:

# ctx_batch_execute 按顺序运行多个命令,在 MCP 层去重
ctx batch-execute \
  --commands "git status" "npm test" "docker ps" \
  --sandbox \
  --dedupe
Enter fullscreen mode Exit fullscreen mode

批量执行器自动在命令之间对重复数据进行去重。上下文窗口只接收唯一、有意义的输出——而不是序列中每个命令的原始日志垃圾。

效果: 一系列 5 个命令通常会生成 200+ KB 的上下文输出,而实际上只生成一个简洁、去重的摘要。智能体获得信号而不是噪音。

数据来源: context-mode GitHub 17,032 Stars;README "Utility Commands" 部分已验证:ctx stats 显示上下文节省、调用次数和会话报告


隐藏用法 #5:实时上下文预算监控

大多数人的用法: 盲目飞行——运行冗长的编程会话,没有任何可见性了解剩余多少上下文预算、智能体何时开始压缩、或哪些工具消耗最多 token。

隐藏技巧:

# 实时上下文预算监控
ctx stats

# 示例输出:
# Calls: 47 | Raw: 2.4 MB | Context: 89 KB | Saved: 96%
# Top consumers: ctx_execute (62%), ctx_index (28%), ctx_search (10%)
Enter fullscreen mode Exit fullscreen mode

ctx stats 命令为你提供每个工具的上下文消耗、节省百分比和会话持续时间的实时明细。你可以准确看到何时预期上下文压缩以及哪些操作是最大的上下文消耗者。

效果: 主动上下文管理。与其在任务中途被上下文压缩惊讶,不如提前预知并可以顺利地 --continue 会话,或在问题变严重之前刷新不需要的上下文。

数据来源: context-mode GitHub 17,032 Stars;README "Utility Commands" 部分已验证:ctx stats → "context savings, call counts, session report";README 基准测试已确认:"Deep repo research — 5 calls, 62 KB context (raw: 986 KB, 94% saved)"


总结:掌握 Context Mode 的 5 个技巧

  1. 持久会话记忆 — ctx_index + FTS5 BM25 跨上下文压缩检索
  2. 跨平台沙箱隔离 — ctx_execute 隔离子进程与继承的权限规则
  3. 结构化 Markdown 索引 — 智能分块分离文本和代码块
  4. 去重批量执行 — ctx_batch_execute 消除冗余上下文输出
  5. 实时上下文预算监控ctx stats 实现主动上下文管理

如果你在使用 Claude Code、Cursor、Qwen Code、Gemini CLI、VS Code Copilot、JetBrains Copilot、OpenCode、KiloCode、OpenClaw、Codex CLI、Antigravity、Kiro、Zed、Pi 或 OMP——Context Mode 开箱即用。钩子支持平台无需配置。

试试看,分享你自己的隐藏用法——或查看 GitHub 仓库 获取完整文档。

数据来源: context-mode GitHub 17,032 Stars / 1,214 Forks(通过直接 API 验证,push 2026-06-10);HN 主帖 570 pts / 107 评论(story ID 47193064);HN Show HN 84 pts / 23 评论;在 Microsoft、Google、Meta、Amazon、IBM、NVIDIA、ByteDance、Stripe、Datadog、Salesforce、GitHub、Red Hat、Supabase、Canva、Notion、Hasura、Framer、Cursor 使用(来自官方 README 徽章);基准测试:Playwright 56.2 KB → 299 B (99%),GitHub Issues 58.9 KB → 1.1 KB (98%),Deep repo research 986 KB → 62 KB (94%);15 个平台兼容性表已验证。

Top comments (0)