AI自愈引擎:为什么你的AI Agent需要一个免疫系统
大模型 API 会挂。这是事实。
OpenAI 宕机、DeepSeek 限流、Claude 504——任何一个在生产环境跑过 LLM 的人都知道。传统方案是在外面套一层网关(LiteLLM 之类的),但这意味着:
- 多 30-200ms 延迟
- 多维护 Docker + PostgreSQL
- 多一个单点故障
换个思路:把自愈能力嵌入 SDK 内部,不要网关。
NeuralBridge 自愈引擎
import neuralbridge as nb
# 自动发现环境变量中的 API Key,自动路由,自动自愈
result = nb.run("用Python写一个快速排序")
print(result.text)
当故障发生时,引擎在 19微秒 内诊断问题类型,然后逐层升级处理:
第1层 重试 → 超时/网络抖动自动重试
第2层 降级 → 部分功能降级,核心功能保持
第3层 切换 → 自动切换到另一个 Provider
第4层 学习 → 记录故障模式,下次更快
效果数据
| 指标 | 数值 |
|---|---|
| 自动恢复率 | 84.1% |
| 诊断耗时 | 19微秒 (P50) |
| 故障模式库 | 280+ |
| 恢复策略 | 30+ |
| 安装体积 | 375 KB |
| 依赖数 | 1个 (httpx) |
多Provider容灾
配置多个 API Key,引擎自动选最健康的:
result = nb.run("你好", providers=["deepseek", "openai", "anthropic"])
print(f"实际使用: {result.provider}") # 自动选最优
print(f"自愈恢复: {result.recovered}") # True=发生了故障自动恢复
马上开始
pip install neuralbridge-sdk
设置环境变量即可:
export DEEPSEEK_API_KEY="sk-xxx"
export OPENAI_API_KEY="sk-xxx"
然后:
import neuralbridge as nb
result = nb.run("写一首关于AI的诗")
print(result.text)
效果
- 5-15% 的 LLM 调用第一次会失败
- NeuralBridge 能自动恢复 84.1% 的故障
- 0 额外延迟,不需要部署任何基础设施
开源 (Apache 2.0):https://github.com/hhhfs9s7y9-code/neuralbridge-sdk
PyPI:https://pypi.org/project/neuralbridge-sdk/
Top comments (0)