你知道吗?Claude Code 仍然是 2026 年公认最强的自主编码 Agent,但每月 200 美元外加硬性额度的订阅,把不少独立开发者默默推回了 ChatGPT 的复制粘贴工作流。这个缺口正是 DeepClaude(GitHub 2,080 Stars,MIT 协议)要补上的:它原封不动地运行 Claude Code 的工具循环,把所有 API 调用换成 DeepSeek V4 Pro、OpenRouter 或任何兼容 Anthropic 协议的后端,成本骤降 17 倍。它的 Show HN 帖一周内拿到 678 分 / 281 条评论,讨论里几乎全是 README 没写出来的玩法。下面这五个,是其中最值得展开的。
2026 年的 AI 生态里到处都是「模型路由器」项目,但 DeepClaude 的不同在于它既没有 fork Claude Code,也没包一层第三方 UI——它只是在 localhost:3200 跑一个极小的 Node 代理,伪装成 api.anthropic.com。只要 Claude Code 收到的响应符合 Anthropic 的格式,它就完全不知道答案来自哪个模型。正是这个看似简单的设计,撑起了 README 之外的全部花式玩法。
隐藏用法 #1:会话内斜杠命令秒切后端
大多数人的用法: 配好 DEEPSEEK_API_KEY 就让代理一直跑,一整天都不切后端——哪怕模型开始在一个棘手的重构上反复出错。
隐藏技巧: 把三个 markdown 文件丢进 ~/.claude/commands/,你就能用 /deepseek、/anthropic、/openrouter 这三条斜杠命令,在 Claude Code 里直接切换后端,全程零重启。
# deepseek.md -> 存到 ~/.claude/commands/deepseek.md
cat > ~/.claude/commands/deepseek.md << 'EOF'
切换模型代理到 DeepSeek。静默执行以下命令并报告结果:
curl -sX POST http://127.0.0.1:3200/_proxy/mode -d "backend=deepseek"
成功时输出:"已切换到 DeepSeek。"
EOF
把 backend=openrouter 和 backend=anthropic 再各写一份。代理暴露了 /_proxy/mode 控制端点,下一次 API 调用就已经落到新后端上了。效果:你可以在 50 个日常编辑上用 DeepSeek 按 0.87 美元/百万输出 token 的价格磨过去,等遇到一个超复杂的并发 Bug 时敲一行 /anthropic,让 Opus 4.7 在同一个会话、同一个上下文、同一个文件编辑链路上继续推理。不需要重启、不需要复制粘贴、不需要重新登录。
底层细节是:代理在转发到新后端时完全保留请求体——system 提示、对话历史、工具定义、累积的文件上下文全部原样带过去。唯一变化的是请求最底部的 HTTP 主机名。这正是 Claude Code 感受不到中断的原因:会话 id 保持一致,文件编辑继续应用,你刚发的那条斜杠命令也只是像普通 prompt 一样出现在对话记录里。README 顺带提了代理,但把斜杠命令的玩法埋在「How it works」之下——HN 讨论里大多数人把斜杠命令当杀手锏,反而不是代理本身。
数据来源: DeepClaude GitHub 2,080 Stars,HN Show HN 主帖 678 分 / 281 条评论(编号 48002136,2026-05-03)。
隐藏用法 #2:与 Anthropic 实时比价的成本追踪
大多数人的用法: 盯着终端猜「今天是不是花太多了」。
隐藏技巧: 代理会记录每一次请求、按后端统计 token 用量,并通过 GET /_proxy/cost 端点把「你实际花了多少」和「同样 token 走 Anthropic 要多少」并排返回。
# 加到 shell rc 里,会话结束随手看一眼省了多少
alias dcost='curl -s http://127.0.0.1:3200/_proxy/cost | jq'
端点返回结构类似:
{
"backends": {
"deepseek": {
"input_tokens": 125000,
"output_tokens": 45000,
"requests": 12,
"cost": 0.0941,
"anthropic_equivalent": 1.05
}
},
"total_cost": 0.0941,
"anthropic_equivalent": 1.05,
"savings": 0.9559
}
效果:当部门负责人问「为什么这个月 Claude Code 账单降了 91%」时,你能拿出按会话、按后端拆分的 JSON 收据。代理用 Anthropic 公开价目(Opus 输出 15 美元/百万 token)算等价成本,所以这个省钱数字是诚实算出来的,不是拍脑袋。代理为每个后端维护独立的 token 计数器,所以即便在同一个会话里在 DeepSeek 和 Anthropic 之间来回切,明细也清清楚楚。
附带的小红利:成本端点还会跟踪 requests 次数,让按任务、按仓库归集花费变得极其简单。把这个调用包成一个按 pwd 区分的 shell 循环,你就免费得到了一个按项目的成本仪表盘。HN 主帖里至少有三条独立评论提到团队用这份 JSON 和财务重谈人均 Claude 预算——多数人反馈,这些数据比任何厂商 pitch deck 都有说服力。
数据来源: DeepClaude GitHub 2,080 Stars,README 中 ## Cost tracking 章节,HN 主帖 678 分(2026-05-03 验证)。
隐藏用法 #3:浏览器远程控制搭配更便宜的大脑
大多数人的用法: SSH 进开发机,或者用 VS Code 自带的 tunnel,才能在路上继续写代码。
隐藏技巧: DeepClaude 把 claude remote-control 的流量拆开——桥接 WebSocket 仍然走 Anthropic(因为是硬编码),但模型 API 调用会被本地代理拦截并转给 DeepSeek。
# 前置条件:claude auth login + Node 18+
deepclaude --remote # 远程控制 + DeepSeek 当大脑
deepclaude --remote -b or # 远程控制 + OpenRouter
deepclaude --remote -b anthropic # 正常模式(全程 Opus)
底层的连接是这样的:
claude remote-control
+-- 桥接 WebSocket -> wss://bridge.claudeusercontent.com(Anthropic,固定)
+-- 模型 API 调用 -> http://localhost:3200(代理)
+-- /v1/messages -> DeepSeek(0.87 美元/百万)
+-- 其它所有路径 -> Anthropic(直通)
效果:你可以在 iPad 上打开 https://claude.ai/code/session_...,口述一个重构,让 DeepSeek 用几毛钱把它跑完——Anthropic 的桥还在,所以 WebSocket 会话是稳的。当任务卡在 DeepSeek 解决不了的地方时,敲一次 /anthropic(隐藏用法 #1),同一个远程会话直接切到 Opus,连接不中断。这个玩法的精髓在于:DeepClaude 的代理只拦 /v1/messages 这一个路径,其余请求原样转发给 Anthropic。
WebSocket 那部分才是真正聪明的地方。Anthropic 的桥接协议是封闭的,外面没有第三方实现。所以 DeepClaude 团队根本没有去重写桥接——他们让 Anthropic 的 CLI 原生打开桥接,只在 HTTP 层做流量切分。这意味着桥接端满意(它看到的是一个来自已登录 Claude Code CLI 的正常 WebSocket),模型层也满意(它收到的是一串符合 Anthropic 格式的 DeepSeek 补全)。当模型的回复经代理回传时,响应结构也保持原样,桥接 WebSocket 就把它原样转给 IDE 或 CLI,仿佛就是 Opus 在回答。
数据来源: DeepClaude GitHub 2,080 Stars,README 中 ## Remote control 章节,HN 主帖 678 分(2026-05-03 验证)。
隐藏用法 #4:把斜杠命令当 CI 钩子用
大多数人的用法: DeepClaude 只在本地交互时用,一到 PR 评审就切回原生 Claude Code 或 CI 脚本,因为代理只在开发机笔记本上跑。
隐藏技巧: 既然斜杠命令本质上就是「调用控制端点」的 markdown 文件,那它在任何 Claude Code 上下文里都有效——包括无头 CI runner、pre-commit 钩子,以及监控 issue 跟踪器的机器人。
# 加到 .github/workflows/pr-triage.yml
- name: 用 DeepSeek 给 PR 分类
run: |
curl -sX POST http://127.0.0.1:3200/_proxy/mode -d "backend=deepseek"
# ...claude-code CLI 在 DeepSeek 上跑 PR 评审(便宜的活)...
curl -sX POST http://127.0.0.1:3200/_proxy/mode -d "backend=anthropic"
# ...真正需要 Opus 推理的环节(安全审计、竞态分析)...
代理监听 localhost:3200,控制端点对本机请求不要求鉴权,所以一个 shell 一行就够用。效果:一条 GitHub Action 在 PR 打开后,让 Claude Code 先用 DeepSeek 处理便宜环节(lint、命名、类型检查、依赖升级),再翻到 Anthropic 处理贵而重的推理(安全评审、并发分析)。每个 PR 的 CI 成本下降 80-90%,但关键环节的评审质量维持在 Opus 水平。
同样的模式可以套到定时任务上:每小时跑一次的 issue 扫描 cron,可以先用 DeepSeek 做便宜的分类(标签建议、重复检测、严重度猜测),只有分数越过阈值时才升级到 Anthropic。代理根本不在乎触发它的是斜杠命令、shell curl,还是 CI runner——它只是跑在某个端口上的 HTTP 服务,这恰恰是当初把控制面选成 HTTP 的全部意义。
数据来源: DeepClaude GitHub 2,080 Stars,README 控制端点文档,HN 主帖 678 分(2026-05-03 验证)。
隐藏用法 #5:先用延迟基准再决定供应商
大多数人的用法: 挑一个后端(通常是 DeepSeek,因为最便宜),从不验证它对自己的工作流是否足够快。
隐藏技巧: DeepClaude 自带一个 --benchmark 标志,会用一个固定 prompt 对所有配置好的后端做往返测试,并并排打印延迟。再也不用猜 OpenRouter 是不是真的比 Fireworks 在你的区域更快。
deepclaude --benchmark
# deepseek : 1.42s 平均(16 次请求)
# openrouter : 0.91s 平均(16 次请求)
# fireworks : 0.38s 平均(16 次请求)
# anthropic : 1.05s 平均(16 次请求)
效果:一张「硬件超市购物清单」。你不再为 1.4 秒一轮的 DeepSeek 付钱,而 Fireworks 美国服务器只要 380 毫秒就能返回同样质量的代码编辑,价格只翻一倍。对于「每个按键都等模型回话」的交互式编码,延迟差异直接决定「Claude Code 感觉很顺」还是「我准备关掉这个 tab 换回 Copilot」。基准测试跑在你自己的机器上、走你自己的真实网络、用你真实的 prompt 形态,所以数字不是合成的。
README 只把 --benchmark 描述成一个「延迟测试」,但几位 HN 评论者指出,可以在它上面再叠一层成本端点,用一条 shell 流水线直接算出「延迟 × 成本」的帕累托前沿。拿到这份数据之后,「我应该默认哪个供应商」就不再是凭感觉的争论,而是一个配置文件。有些团队甚至把结果提交到仓库的 vendor-bench.md,让新贡献者第一天就知道应该设哪个后端。
数据来源: DeepClaude GitHub 2,080 Stars,README 中 ## Quick start 的 --benchmark 标志,HN 主帖 678 分(2026-05-03 验证)。
总结
-
斜杠命令秒切后端——三个 markdown 文件塞进
~/.claude/commands/,就能用/deepseek、/anthropic、/openrouter在会话中切换后端,零重启。 -
与 Anthropic 实时比价的成本追踪——
GET /_proxy/cost按后端返回 token 数 + 诚实的 Anthropic 等价金额,月度复盘直接可用。 -
浏览器远程控制搭配更便宜的大脑——代理只拦
/v1/messages,Anthropic 的桥接 WebSocket 保活,DeepSeek 干苦活。 - 把斜杠命令当 CI 钩子——同样的控制端点能在 GitHub Actions 里调用,实现「lint 用 DeepSeek,安全用 Anthropic」的分阶段流水线。
-
延迟基准测试——
--benchmark对每个供应商做真实网络往返,别再为慢后端多花钱,也别因为后端慢就换工具。
想了解更多上下文,这里有三篇之前的文章,深入探讨了自主 Agent 的更大图景:
- Claude Code 的 5 个隐藏用法,99% 的开发者都不知道——DeepClaude 真正代理的那条 Agent 循环。
- Addy Osmani 的 agent-skills:49K 星工作流魔法里没人提的 5 个隐藏用法——与上面斜杠命令玩法非常契合的工作流模式。
- Tabby 的 5 个隐藏用法——如果你想彻底消灭 API 账单,可以走自托管开源这条路。
你在会话里做过的最野的一次后端切换是什么?留个评论——很想知道你搭配的是 DeepSeek + 本地模型、微调模型,还是什么我没见过的新组合。
Top comments (0)