DeepClaude 的 5 个隐藏用法：让你的 Claude Code 便宜 17 倍 🔥

你知道吗？Claude Code 仍然是 2026 年公认最强的自主编码 Agent，但每月 200 美元外加硬性额度的订阅，把不少独立开发者默默推回了 ChatGPT 的复制粘贴工作流。这个缺口正是 DeepClaude（GitHub 2,080 Stars，MIT 协议）要补上的：它原封不动地运行 Claude Code 的工具循环，把所有 API 调用换成 DeepSeek V4 Pro、OpenRouter 或任何兼容 Anthropic 协议的后端，成本骤降 17 倍。它的 Show HN 帖一周内拿到 678 分 / 281 条评论，讨论里几乎全是 README 没写出来的玩法。下面这五个，是其中最值得展开的。

2026 年的 AI 生态里到处都是「模型路由器」项目，但 DeepClaude 的不同在于它既没有 fork Claude Code，也没包一层第三方 UI——它只是在 localhost:3200 跑一个极小的 Node 代理，伪装成 api.anthropic.com。只要 Claude Code 收到的响应符合 Anthropic 的格式，它就完全不知道答案来自哪个模型。正是这个看似简单的设计，撑起了 README 之外的全部花式玩法。

隐藏用法 #1：会话内斜杠命令秒切后端

大多数人的用法： 配好 DEEPSEEK_API_KEY 就让代理一直跑，一整天都不切后端——哪怕模型开始在一个棘手的重构上反复出错。

隐藏技巧： 把三个 markdown 文件丢进 ~/.claude/commands/，你就能用 /deepseek、/anthropic、/openrouter 这三条斜杠命令，在 Claude Code 里直接切换后端，全程零重启。

# deepseek.md -> 存到 ~/.claude/commands/deepseek.md
cat > ~/.claude/commands/deepseek.md << 'EOF'
切换模型代理到 DeepSeek。静默执行以下命令并报告结果：
curl -sX POST http://127.0.0.1:3200/_proxy/mode -d "backend=deepseek"
成功时输出："已切换到 DeepSeek。"
EOF

把 backend=openrouter 和 backend=anthropic 再各写一份。代理暴露了 /_proxy/mode 控制端点，下一次 API 调用就已经落到新后端上了。效果：你可以在 50 个日常编辑上用 DeepSeek 按 0.87 美元/百万输出 token 的价格磨过去，等遇到一个超复杂的并发 Bug 时敲一行 /anthropic，让 Opus 4.7 在同一个会话、同一个上下文、同一个文件编辑链路上继续推理。不需要重启、不需要复制粘贴、不需要重新登录。

底层细节是：代理在转发到新后端时完全保留请求体——system 提示、对话历史、工具定义、累积的文件上下文全部原样带过去。唯一变化的是请求最底部的 HTTP 主机名。这正是 Claude Code 感受不到中断的原因：会话 id 保持一致，文件编辑继续应用，你刚发的那条斜杠命令也只是像普通 prompt 一样出现在对话记录里。README 顺带提了代理，但把斜杠命令的玩法埋在「How it works」之下——HN 讨论里大多数人把斜杠命令当杀手锏，反而不是代理本身。

数据来源： DeepClaude GitHub 2,080 Stars，HN Show HN 主帖 678 分 / 281 条评论（编号 48002136，2026-05-03）。

隐藏用法 #2：与 Anthropic 实时比价的成本追踪

大多数人的用法： 盯着终端猜「今天是不是花太多了」。

隐藏技巧： 代理会记录每一次请求、按后端统计 token 用量，并通过 GET /_proxy/cost 端点把「你实际花了多少」和「同样 token 走 Anthropic 要多少」并排返回。

# 加到 shell rc 里，会话结束随手看一眼省了多少
alias dcost='curl -s http://127.0.0.1:3200/_proxy/cost | jq'

端点返回结构类似：

{
  "backends": {
    "deepseek": {
      "input_tokens": 125000,
      "output_tokens": 45000,
      "requests": 12,
      "cost": 0.0941,
      "anthropic_equivalent": 1.05
    }
  },
  "total_cost": 0.0941,
  "anthropic_equivalent": 1.05,
  "savings": 0.9559
}

效果：当部门负责人问「为什么这个月 Claude Code 账单降了 91%」时，你能拿出按会话、按后端拆分的 JSON 收据。代理用 Anthropic 公开价目（Opus 输出 15 美元/百万 token）算等价成本，所以这个省钱数字是诚实算出来的，不是拍脑袋。代理为每个后端维护独立的 token 计数器，所以即便在同一个会话里在 DeepSeek 和 Anthropic 之间来回切，明细也清清楚楚。

附带的小红利：成本端点还会跟踪 requests 次数，让按任务、按仓库归集花费变得极其简单。把这个调用包成一个按 pwd 区分的 shell 循环，你就免费得到了一个按项目的成本仪表盘。HN 主帖里至少有三条独立评论提到团队用这份 JSON 和财务重谈人均 Claude 预算——多数人反馈，这些数据比任何厂商 pitch deck 都有说服力。

数据来源： DeepClaude GitHub 2,080 Stars，README 中 ## Cost tracking 章节，HN 主帖 678 分（2026-05-03 验证）。

隐藏用法 #3：浏览器远程控制搭配更便宜的大脑

大多数人的用法： SSH 进开发机，或者用 VS Code 自带的 tunnel，才能在路上继续写代码。

隐藏技巧： DeepClaude 把 claude remote-control 的流量拆开——桥接 WebSocket 仍然走 Anthropic（因为是硬编码），但模型 API 调用会被本地代理拦截并转给 DeepSeek。

# 前置条件：claude auth login + Node 18+
deepclaude --remote                # 远程控制 + DeepSeek 当大脑
deepclaude --remote -b or          # 远程控制 + OpenRouter
deepclaude --remote -b anthropic   # 正常模式（全程 Opus）

底层的连接是这样的：

claude remote-control
  +-- 桥接 WebSocket -> wss://bridge.claudeusercontent.com（Anthropic，固定）
  +-- 模型 API 调用  -> http://localhost:3200（代理）
                          +-- /v1/messages -> DeepSeek（0.87 美元/百万）
                          +-- 其它所有路径  -> Anthropic（直通）

效果：你可以在 iPad 上打开 https://claude.ai/code/session_...，口述一个重构，让 DeepSeek 用几毛钱把它跑完——Anthropic 的桥还在，所以 WebSocket 会话是稳的。当任务卡在 DeepSeek 解决不了的地方时，敲一次 /anthropic（隐藏用法 #1），同一个远程会话直接切到 Opus，连接不中断。这个玩法的精髓在于：DeepClaude 的代理只拦 /v1/messages 这一个路径，其余请求原样转发给 Anthropic。

WebSocket 那部分才是真正聪明的地方。Anthropic 的桥接协议是封闭的，外面没有第三方实现。所以 DeepClaude 团队根本没有去重写桥接——他们让 Anthropic 的 CLI 原生打开桥接，只在 HTTP 层做流量切分。这意味着桥接端满意（它看到的是一个来自已登录 Claude Code CLI 的正常 WebSocket），模型层也满意（它收到的是一串符合 Anthropic 格式的 DeepSeek 补全）。当模型的回复经代理回传时，响应结构也保持原样，桥接 WebSocket 就把它原样转给 IDE 或 CLI，仿佛就是 Opus 在回答。

数据来源： DeepClaude GitHub 2,080 Stars，README 中 ## Remote control 章节，HN 主帖 678 分（2026-05-03 验证）。

隐藏用法 #4：把斜杠命令当 CI 钩子用

大多数人的用法： DeepClaude 只在本地交互时用，一到 PR 评审就切回原生 Claude Code 或 CI 脚本，因为代理只在开发机笔记本上跑。

隐藏技巧： 既然斜杠命令本质上就是「调用控制端点」的 markdown 文件，那它在任何 Claude Code 上下文里都有效——包括无头 CI runner、pre-commit 钩子，以及监控 issue 跟踪器的机器人。

# 加到 .github/workflows/pr-triage.yml
- name: 用 DeepSeek 给 PR 分类
  run: |
    curl -sX POST http://127.0.0.1:3200/_proxy/mode -d "backend=deepseek"
    # ...claude-code CLI 在 DeepSeek 上跑 PR 评审（便宜的活）...
    curl -sX POST http://127.0.0.1:3200/_proxy/mode -d "backend=anthropic"
    # ...真正需要 Opus 推理的环节（安全审计、竞态分析）...

代理监听 localhost:3200，控制端点对本机请求不要求鉴权，所以一个 shell 一行就够用。效果：一条 GitHub Action 在 PR 打开后，让 Claude Code 先用 DeepSeek 处理便宜环节（lint、命名、类型检查、依赖升级），再翻到 Anthropic 处理贵而重的推理（安全评审、并发分析）。每个 PR 的 CI 成本下降 80-90%，但关键环节的评审质量维持在 Opus 水平。

同样的模式可以套到定时任务上：每小时跑一次的 issue 扫描 cron，可以先用 DeepSeek 做便宜的分类（标签建议、重复检测、严重度猜测），只有分数越过阈值时才升级到 Anthropic。代理根本不在乎触发它的是斜杠命令、shell curl，还是 CI runner——它只是跑在某个端口上的 HTTP 服务，这恰恰是当初把控制面选成 HTTP 的全部意义。

数据来源： DeepClaude GitHub 2,080 Stars，README 控制端点文档，HN 主帖 678 分（2026-05-03 验证）。

隐藏用法 #5：先用延迟基准再决定供应商

大多数人的用法： 挑一个后端（通常是 DeepSeek，因为最便宜），从不验证它对自己的工作流是否足够快。

隐藏技巧： DeepClaude 自带一个 --benchmark 标志，会用一个固定 prompt 对所有配置好的后端做往返测试，并并排打印延迟。再也不用猜 OpenRouter 是不是真的比 Fireworks 在你的区域更快。

deepclaude --benchmark
# deepseek    : 1.42s 平均（16 次请求）
# openrouter  : 0.91s 平均（16 次请求）
# fireworks   : 0.38s 平均（16 次请求）
# anthropic   : 1.05s 平均（16 次请求）

效果：一张「硬件超市购物清单」。你不再为 1.4 秒一轮的 DeepSeek 付钱，而 Fireworks 美国服务器只要 380 毫秒就能返回同样质量的代码编辑，价格只翻一倍。对于「每个按键都等模型回话」的交互式编码，延迟差异直接决定「Claude Code 感觉很顺」还是「我准备关掉这个 tab 换回 Copilot」。基准测试跑在你自己的机器上、走你自己的真实网络、用你真实的 prompt 形态，所以数字不是合成的。

README 只把 --benchmark 描述成一个「延迟测试」，但几位 HN 评论者指出，可以在它上面再叠一层成本端点，用一条 shell 流水线直接算出「延迟 × 成本」的帕累托前沿。拿到这份数据之后，「我应该默认哪个供应商」就不再是凭感觉的争论，而是一个配置文件。有些团队甚至把结果提交到仓库的 vendor-bench.md，让新贡献者第一天就知道应该设哪个后端。

数据来源： DeepClaude GitHub 2,080 Stars，README 中 ## Quick start 的 --benchmark 标志，HN 主帖 678 分（2026-05-03 验证）。

总结

斜杠命令秒切后端——三个 markdown 文件塞进 ~/.claude/commands/，就能用 /deepseek、/anthropic、/openrouter 在会话中切换后端，零重启。
与 Anthropic 实时比价的成本追踪——GET /_proxy/cost 按后端返回 token 数 + 诚实的 Anthropic 等价金额，月度复盘直接可用。
浏览器远程控制搭配更便宜的大脑——代理只拦 /v1/messages，Anthropic 的桥接 WebSocket 保活，DeepSeek 干苦活。
把斜杠命令当 CI 钩子——同样的控制端点能在 GitHub Actions 里调用，实现「lint 用 DeepSeek，安全用 Anthropic」的分阶段流水线。
延迟基准测试——--benchmark 对每个供应商做真实网络往返，别再为慢后端多花钱，也别因为后端慢就换工具。