hhhfs9s7y9-code

Posted on Jun 21

SDK vs API 网关：你的 AI Agent 真的需要中间代理吗？

#llm #architecture #python #devops

部署 LLM 应用时，面临一个架构选择：是走 API 网关，还是直接用 SDK 在进程内解决？

这不是一个理论问题——它直接影响你的生产系统的延迟、成本和运维负担。

架构对比：两种方案的典型拓扑

Agent 进程 → HTTP 请求 → LiteLLM/Portkey 网关 → LLM Provider
                            ↑
                        额外网络跳转（50-200ms）

网关作为独立服务运行，所有 LLM 调用先经过网关，由网关负责路由、重试、限流。

Agent 进程（内嵌 NeuralBridge SDK）
  → 故障检测（22 µs）
  → 重试/降级/切换
  → 直接调用 LLM Provider

SDK 作为库嵌入到 Agent 进程中，直接在进程内完成自愈逻辑。

网关方案增加延迟的三个来源：

嵌入式 SDK 方案不需要这些：

22 µs vs 65 ms 的诊断延迟差 ≈ 2955 倍。注意这是诊断延迟，不是完整调用延迟——但它说明了一个关键点：嵌入式的架构优势是量化的，不是概念性的。

一个独立的 API 网关通常需要 0.5 FTE 来维护（来源：行业经验估计）。对于中小团队来说，这是直接的人力成本。

这两种方案并非互斥。一个可行的架构是：

这样既避免了请求路径上的额外延迟，又保留了集中管理的优势。

NeuralBridge SDK 通过 3 种集成方式适配不同架构：直接替换 import（最少侵入）、HTTP 网关模式（兼容 OpenAI 协议）、侧车进程模式（零代码变更）。SDK 大小约 375 KB，仅依赖 httpx。