DEV Community

Garyvov
Garyvov

Posted on

Mistral Small 4:开源 AI 的三合一革命

Mistral Small 4:开源 AI 的三合一革命

2026 年 3 月 16 日,Mistral AI 发布 Small 4,这是首个统一指令、推理和多模态能力的开源模型,以 Apache 2.0 协议重新定义开源 AI 标准。

开源 AI 模型


一句话讲清楚

Mistral Small 4 是首个真正统一的开源模型

  • 以前:聊天用 Small,推理用 Magistral,多模态用 Pixtral,代码用 Devstral
  • 现在:一个模型搞定所有

而且完全开源,Apache 2.0 协议,商用、修改、分发、私有部署全放开。


核心亮点

1. 可配置的推理强度

通过 reasoning_effort 参数,同一个模型有两种工作模式

# 日常聊天 - 快速响应
reasoning_effort="none"

# 复杂问题 - 深度思考
reasoning_effort="high"
Enter fullscreen mode Exit fullscreen mode

这相当于两个模型合成一个,省了切换的成本。

2. 架构参数

特性 数值
总参数 119B
活跃参数 6B (每 token)
专家数量 128
每 token 活跃专家 4
上下文窗口 256k tokens
多模态 原生支持图文输入

采用 Mixture of Experts (MoE) 架构,效率与性能的平衡点找得很准。

3. 性能提升

相比 Mistral Small 3:

  • 延迟降低 40% (延迟优化配置)
  • 吞吐量提升 3 倍 (吞吐量优化配置)

更重要的是:在 AA LCR、LiveCodeBench 等基准测试中:

模型 AA LCR 分数 输出长度
Mistral Small 4 0.72 1.6K
Qwen3 0.72 5.8K
Qwen2.5 0.71 6.1K

相同性能,输出减少 75% = 推理成本大幅降低

这个差距在实际应用中很关键:更短的响应意味着更低的延迟和成本,用户体验更好。


部署成本

最小配置

  • 4x NVIDIA HGX H100
  • 或 2x NVIDIA HGX H200
  • 或 1x NVIDIA DGX B200

推荐配置

  • 4x NVIDIA HGX H100
  • 或 4x NVIDIA HGX H200
  • 或 2x NVIDIA DGX B200

好消息是,通过 NVIDIA 优化,支持 vLLM、llama.cpp、SGLang、Transformers 等主流推理框架。


应用场景

开发者

  • 代码自动化
  • 代码库探索
  • 代理工作流

企业

  • 智能助手
  • 文档理解
  • 多模态分析

研究人员

  • 数学问题
  • 科研分析
  • 复杂推理

如何获取

1. Hugging Face

模型仓库:https://huggingface.co/collections/mistralai/mistral-small-4

2. NVIDIA Build

免费原型开发:https://build.nvidia.com/mistralai/mistral-small-4-119b-2603

3. Mistral AI Studio

API 服务:https://mistral.ai/products/studio

4. NVIDIA NIM

生产环境可直接部署优化的容器化推理服务。


为什么重要?

  1. 首次统一能力:不再需要多个模型切换,简化 AI 集成
  2. 完全开源:Apache 2.0,真正的开源自由
  3. 企业级效率:部署成本可控,性能优秀
  4. 社区合作:NVIDIA Nemotron Coalition 创始成员

技术细节

推理效率对比

Mistral Small 4 与 GPT-OSS 120B 对比:

  • AA LCR:Mistral 0.72 (1.6K) vs GPT-OSS 0.71 (5.5K+)
  • LiveCodeBench:Mistral 超越 GPT-OSS,输出减少 20%

关键点:相同性能下,Mistral 的输出长度显著更短。这意味着:

  • 更低的推理延迟
  • 更低的计算成本
  • 更好的用户体验

未来展望

Mistral AI 表示:"AI 的未来是开源的"

通过统一指令、推理和多模态能力,Mistral Small 4 简化了 AI 集成,让单一模型可以应对更广泛的任务。

对于企业来说,这意味着:

  • 更低的集成成本
  • 更简化的技术栈
  • 更好的成本控制

对于开发者来说,这意味着:

  • 一个模型适配所有场景
  • 按需调整推理强度
  • 更灵活的部署方案

总结

Mistral Small 4 的发布是开源 AI 领域的一个重要里程碑:

  1. 统一能力:一次集成,多种场景
  2. 开源自由:Apache 2.0,完全可控
  3. 性能优势:效率更高,成本更低
  4. 企业友好:NVIDIA 优化,部署方便

推荐关注:如果你在使用开源模型,或者考虑在企业中部署 AI,Mistral Small 4 值得重点关注。


本文基于 Mistral AI 官方公告整理,数据截至 2026 年 3 月 16 日

原文链接:https://mistral.ai/news/mistral-small-4

Top comments (0)

Some comments may only be visible to logged-in visitors. Sign in to view all comments.