correctover

Posted on Jun 21 • Edited on Jun 25

NeuralBridge 实测基准数据：1M 调用下的 LLM 自愈性能报告

#benchmark #llm #selfhealing #python

Brand Update: NeuralBridge has been upgraded to Correctover可瑞沃 — Enterprise AI Reliability Infrastructure. Same SDK, new name, expanded capabilities (6-dimension contract validation, verified failover, drift detection). ➡️ pip install correctover | Learn more about the upgrade

本文公布 NeuralBridge SDK 的完整基准测试数据，基于 1,000,000 次 API 调用实测，涵盖故障诊断延迟、熔断检查开销、遥测吞吐量等核心指标。

测试环境

参数	值
测试次数	1,000,000
测试环境	Python 3.12, Intel Xeon, Linux 5.15
Provider 模拟	8 个虚拟 Provider（含故障注入）
故障注入量	70,000 次
SDK 版本	v5.2.11

一、核心性能指标

1. 故障诊断延迟

百分位	延迟	说明
P50	22 µs	半数诊断在 22 微秒内完成
P90	31 µs	90% 诊断在 31 微秒内完成
P95	38 µs	95% 诊断在 38 微秒内完成
P99	47 µs	99% 诊断在 47 微秒内完成

这意味着什么？ 故障诊断的 P99 延迟（47µs）比一次 API 网络调用的零头还小（网络调用通常 50-200ms）。用户完全感知不到自愈引擎的存在。

2. 熔断检查开销

百分位	延迟
P50	0.4 µs
P99	1.2 µs

熔断检查的 P50 仅 0.4 微秒——几乎为零开销。每次 API 调用携带一次熔断检查的成本可以忽略不计。

3. 遥测吞吐量

指标	数值
每秒处理记录数	177,582 rec/s
单条遥测记录大小	~256 bytes

即使在高并发场景下，遥测系统也能稳定处理每秒 17.7 万条记录，不会成为性能瓶颈。

二、故障注入测试结果

在 70,000 次故障注入测试中：

故障类型	注入次数	诊断准确率	恢复��功率
429 限流	20,000	99.8%	98.5%
500 错误	15,000	99.5%	96.2%
连接超时	12,000	98.7%	94.1%
模型降级	10,000	96.3%	91.5%
输出异常	8,000	94.2%	89.8%
认证失败	5,000	99.1%	97.3%

总体平均诊断准确率：98.3%

总体平均恢复成功率：95.1%

数据说明：测试在受控环境下进行，实际生产表现可能因网络状况、Provider 状态等因素而有所差异。

三、资源占用

SDK 包大小

语言	包大小	运行时依赖
Python	~375 KB	1 个（httpx）
TypeScript	~280 KB	2 个
Go	~1.2 MB（编译后）	0 个

内存占用

场景	内存占用
空闲（已初始化）	~12 MB
运行时（100 QPS）	~28 MB
运行时（1000 QPS）	~64 MB

四、与竞品性能对比

指标	NeuralBridge	LiteLLM（网关）	自研方案（平均）
自愈/容错开销	22 µs（进程内）	200-500 ms（网络跳转）	50-200 ms
熔断检查	0.4 µs	无此功能	10-100 µs
故障类型覆盖	24 类	仅连接错误	3-5 类
输出验证	✅ Contract	❌	❌
多语言支持	Python/TS/Go	Python	单语言
部署方式	pip install	Docker/k8s	自建
架构	MAPE-K 自愈	代理网关	手动容错

五、Scalability 测试

并发连接数	平均延迟	P99 延迟	吞吐量
10	22 µs	35 µs	18,000 req/s
50	24 µs	40 µs	85,000 req/s
100	28 µs	47 µs	150,000 req/s
500	35 µs	62 µs	177,000 req/s

SDK 在高并发下的性能表现稳定，500 并发时 P99 延迟仍控制在 62 µs。

六、技术要点

MAPE-K 闭环为什么比传统重试快？

传统重试：请求失败 → 抛出异常 → 捕获异常 → 延迟后重试（多次上下文切换）

MAPE-K 自愈：请求失败 → 进程内分析故障类型 → 知识库匹配 → 执行恢复（零上下文切换）

为什么进程内架构延迟比网关低 4 个数量级？

网关方案：你的进程 → HTTP 请求到网关 → 网关解析转发 → 网关收到响应 → HTTP 回传（4 次网络 I/O）

进程内方案：你的函数调用 SDK → SDK 分析并直连 Provider（0 次额外网络 I/O）

七、测试复现

你可以自己验证这些数据：

git clone https://github.com/neuralbridge-sdk/neuralbridge-sdk
cd neuralbridge-sdk
pip install -e .
python neuralbridge-world-benchmark.py

结论

NeuralBridge 的基准数据表明：进程内 MAPE-K 自愈架构在生产环境中不仅可行，而且高性能。

故障诊断 P50 仅 22 µs（比网关快 4 个数量级）
熔断检查仅 0.4 µs（几乎零开销）
覆盖 24 类故障，诊断准确率 98.3%
SDK 仅 ~375 KB，1 个运行时依赖

这些数据验证了核心设计理念：LLM API 的自愈能力不应该以牺牲性能为代价。进程内架构可以同时做到"零额外延迟"和"全面容错"。

pip install neuralbridge-sdk

NeuralBridge — 基于 MAPE-K 双飞轮自学习的进程内 LLM 自愈引擎 | GitHub | PyPI

DEV Community