Garyvov

Posted on Mar 16

Mistral Small 4：开源 AI 的三合一革命

#career

Mistral Small 4：开源 AI 的三合一革命

2026 年 3 月 16 日，Mistral AI 发布 Small 4，这是首个统一指令、推理和多模态能力的开源模型，以 Apache 2.0 协议重新定义开源 AI 标准。

一句话讲清楚

Mistral Small 4 是首个真正统一的开源模型：

以前：聊天用 Small，推理用 Magistral，多模态用 Pixtral，代码用 Devstral
现在：一个模型搞定所有

而且完全开源，Apache 2.0 协议，商用、修改、分发、私有部署全放开。

核心亮点

1. 可配置的推理强度

通过 reasoning_effort 参数，同一个模型有两种工作模式：

# 日常聊天 - 快速响应
reasoning_effort="none"

# 复杂问题 - 深度思考
reasoning_effort="high"

这相当于两个模型合成一个，省了切换的成本。

2. 架构参数

特性	数值
总参数	119B
活跃参数	6B (每 token)
专家数量	128
每 token 活跃专家	4
上下文窗口	256k tokens
多模态	原生支持图文输入

采用 Mixture of Experts (MoE) 架构，效率与性能的平衡点找得很准。

3. 性能提升

相比 Mistral Small 3：

延迟降低 40% (延迟优化配置)
吞吐量提升 3 倍 (吞吐量优化配置)

更重要的是：在 AA LCR、LiveCodeBench 等基准测试中：

模型	AA LCR 分数	输出长度
Mistral Small 4	0.72	1.6K
Qwen3	0.72	5.8K
Qwen2.5	0.71	6.1K

相同性能，输出减少 75% = 推理成本大幅降低

这个差距在实际应用中很关键：更短的响应意味着更低的延迟和成本，用户体验更好。

部署成本

最小配置

4x NVIDIA HGX H100
或 2x NVIDIA HGX H200
或 1x NVIDIA DGX B200

应用场景

开发者

代码自动化
代码库探索
代理工作流

企业

智能助手
文档理解
多模态分析

研究人员

数学问题
科研分析
复杂推理

如何获取

4. NVIDIA NIM

生产环境可直接部署优化的容器化推理服务。

为什么重要？

首次统一能力：不再需要多个模型切换，简化 AI 集成
完全开源：Apache 2.0，真正的开源自由
企业级效率：部署成本可控，性能优秀
社区合作：NVIDIA Nemotron Coalition 创始成员

技术细节

推理效率对比

Mistral Small 4 与 GPT-OSS 120B 对比：

AA LCR：Mistral 0.72 (1.6K) vs GPT-OSS 0.71 (5.5K+)
LiveCodeBench：Mistral 超越 GPT-OSS，输出减少 20%

关键点：相同性能下，Mistral 的输出长度显著更短。这意味着：

更低的推理延迟
更低的计算成本
更好的用户体验

未来展望

Mistral AI 表示："AI 的未来是开源的"

通过统一指令、推理和多模态能力，Mistral Small 4 简化了 AI 集成，让单一模型可以应对更广泛的任务。

对于企业来说，这意味着：

更低的集成成本
更简化的技术栈
更好的成本控制

对于开发者来说，这意味着：

一个模型适配所有场景
按需调整推理强度
更灵活的部署方案

总结

Mistral Small 4 的发布是开源 AI 领域的一个重要里程碑：

✅ 统一能力：一次集成，多种场景
✅ 开源自由：Apache 2.0，完全可控
✅ 性能优势：效率更高，成本更低
✅ 企业友好：NVIDIA 优化，部署方便

推荐关注：如果你在使用开源模型，或者考虑在企业中部署 AI，Mistral Small 4 值得重点关注。

本文基于 Mistral AI 官方公告整理，数据截至 2026 年 3 月 16 日

原文链接：https://mistral.ai/news/mistral-small-4

Top comments (0)

Some comments may only be visible to logged-in visitors. Sign in to view all comments.

DEV Community

Mistral Small 4：开源 AI 的三合一革命

Mistral Small 4：开源 AI 的三合一革命

一句话讲清楚

核心亮点

1. 可配置的推理强度

2. 架构参数

3. 性能提升

部署成本

最小配置

推荐配置

应用场景

开发者

企业

研究人员

如何获取

1. Hugging Face

2. NVIDIA Build

3. Mistral AI Studio

4. NVIDIA NIM

为什么重要？

技术细节

推理效率对比

未来展望

总结

Top comments (0)