Akira

Posted on Jun 1 • Originally published at apidog.com

MiniMax M3とは？初のオープンウェイトフロンティアコーディングモデル

MiniMax M3は、MiniMaxが2026年6月1日にリリースしたオープンウェイトAIモデルです。最先端のコーディング能力、最大1,000,000トークンのコンテキストウィンドウ、画像・ビデオ入力とデスクトップ操作を扱うネイティブなマルチモダリティを、1つのシステムに統合しています。

今すぐApidogを試す

この組み合わせがM3の最大の特徴です。強力なコーディング、長大なコンテキスト、マルチモーダル入力のうち1つか2つを得意とするモデルはありますが、M3は3つすべてを同時に扱うことを目指しています。MiniMaxは、リリースから約10日以内にオープンウェイトと完全な技術レポートを公開するとしています。つまり、現在紹介されているモデルは、近いうちに自己ホスト可能になる予定です。Qwen 3.7のようなオープンウェイトモデルの動向を追っている場合、M3は次に確認すべきモデルです。発表内容の詳細はMiniMax M3の公式発表で確認できます。

この記事では、M3の特徴、MiniMaxが公開したベンチマーク、長文コンテキストを低コストに扱うアーキテクチャ、M3で構築できるもの、APIでのアクセス方法を実装視点で整理します。

💡 M3をアプリケーションに組み込む場合、API応答、ツール呼び出し、スキーマのずれを検査する仕組みが必要です。ApidogのようなAPIテストツールを使うと、モデル応答を確認しながら実装を進めやすくなります。

M3の独自性

多くのフロンティアモデルでは、次のいずれかを選ぶ必要があります。

強力なコーディング能力
巨大なコンテキストウィンドウ
画像・ビデオ・画面操作を含むマルチモーダル能力

M3の主張は、これらを単一のオープンウェイトモデルで扱えるようにすることです。

M3の特徴は、実装視点では次の3点に整理できます。

コーディング能力

M3は、コーディングおよびエージェント型ソフトウェア開発ベンチマークにおいて、強力なクローズドモデルに近い性能を目指しています。
100万トークンのコンテキスト

最大1,000,000トークンを一度に入力できます。大規模コードベース、長い仕様書、ログ、設計ドキュメント、長期チャット履歴などを、過度に切り詰めずに扱える可能性があります。
ネイティブなマルチモダリティ

画像とビデオを入力として扱えます。MiniMaxは、ローカルERPクライアントを開き、請求書を自動でバッチ入力するデモも紹介しています。

オープンウェイトである点も重要です。ウェイトが公開されれば、機密性の高いワークロードを自社環境で実行したり、特定ドメイン向けに調整したり、呼び出し単位のベンダーロックインを避けたりできます。この方向への市場の動きについては、2026年の中国LLM価格競争も参考になります。

重要な数字

MiniMaxはリリース時にベンチマーク結果を公開しました。ただし、これらはベンダー報告値です。独立した第三者評価ではなく、MiniMax自身の測定値として扱う必要があります。

特に注目されるのは、SWE-Bench Proで59.0%という結果です。SWE-Bench Proは、実際のソフトウェアエンジニアリングタスクに基づく難度の高いベンチマークです。詳細はSWE-Benchプロジェクトサイトで確認できます。

MiniMaxによると、M3はSWE-Bench ProでGPT-5.5とGemini 3.1 Proを上回り、Claude Opus 4.7に近い結果を出しています。オープンウェイトモデルとしては強い主張です。

一方で、M3がすべての指標で勝っているわけではありません。PostTrainBenchでは0.37で、Opus 4.7の0.42、GPT-5.5の0.39を下回っています。このように差分が明示されている点は、ベンチマークを読む上で重要です。

現時点で未公開の重要情報もあります。

総パラメーター数
アクティブパラメーター数
詳細な学習・推論構成

これらは技術レポートで公開される予定です。そのため、現時点ではパラメーターあたりの性能やコストを正確に比較することはできません。クローズドモデルとの比較を詳しく知りたい場合は、MiniMax M3 vs Opus 4.7 vs GPT-5.5を参照してください。

MSAアーキテクチャを実装視点で理解する

M3の長文コンテキスト効率は、MSA（MiniMax Sparse Attention）に由来します。

通常のアテンションでは、各トークンが他のすべてのトークンと関係を計算します。コンテキスト長が増えるほど計算量が急増するため、100万トークン級のウィンドウは非常に高コストになります。

MSAでは、すべてのトークンに対して密にアテンションするのではなく、選択されたサブセットに対して疎にアテンションします。MiniMaxによると、これによりトークンあたりの計算量が前世代モデルの約1/20に削減されます。

実装上の効果は、主に2つあります。

プレフィルの高速化

プロンプト読み取りが9倍以上高速化。
デコードの高速化

応答生成が15倍以上高速化。

長文コンテキストを扱うアプリケーションでは、この差が大きくなります。たとえば次のようなケースです。

リポジトリ全体を読み込ませてリファクタリング案を出す
大量のAPI仕様書から実装計画を作る
複数ファイルにまたがるバグを調査する
長期間のエージェント実行ログを保持したまま次の判断をさせる

従来は、チャンク分割、RAG、要約、再ランキングなどでコンテキストを圧縮する必要がありました。M3のような長文コンテキストモデルでは、これらを完全に不要にするわけではありませんが、「どこまで直接モデルに渡すか」の設計幅が広がります。

M3で構築できるもの

M3は、長時間実行され、複数ステップを経て成果物を作るエージェント型ワークロードに向いています。MiniMaxは、次のようなデモを公開しています。

24時間CUDAカーネル最適化

M3が自律的にカーネル最適化に取り組み、9.4倍の高速化を達成。
論文再現エージェント

18回のコミットを経て研究論文を再現し、23の実験図を生成。
コンピューター操作

ローカルERPクライアントを開き、請求書を一括入力。

実際に開発者がM3を使う場合、次のような実装パターンが考えられます。

1. コードレビューエージェント

大きなプルリクエストや複数モジュールの差分を読み込み、設計上の問題、テスト不足、破壊的変更を検出します。

入力:
- 変更されたファイル一覧
- 関連する既存コード
- テスト結果
- API仕様

出力:
- リスクのある変更点
- 修正案
- 追加すべきテストケース

2. リポジトリ理解ボット

大規模コードベースを対象に、依存関係、主要モジュール、データフローを説明させます。

質問:
このリポジトリでユーザー認証がどのように実装されているか、
関連ファイルと処理フローを示してください。

3. ツール呼び出し型エージェント

M3に外部API、DB操作、CI実行、ファイル編集などのツールを接続し、複数ステップの作業を実行させます。

この場合、重要になるのはモデル性能だけではありません。ツール呼び出しのスキーマ、引数、エラー処理、再試行ロジックがワークフローの安定性を決めます。

たとえば、ツール呼び出しの期待スキーマが次のような場合を考えます。

{
  "tool": "create_issue",
  "arguments": {
    "title": "string",
    "body": "string",
    "labels": ["string"]
  }
}

モデルが次のような不正形式を返すと、ワークフローが止まる可能性があります。

{
  "tool": "create_issue",
  "args": {
    "name": "Bug in payment flow",
    "description": "..."
  }
}

このようなずれを検出するには、API応答をキャプチャし、スキーマ検証する仕組みが必要です。Apidogを使えば、M3のAPI応答やツール呼び出し結果を確認し、本番環境に流す前に形式の問題を見つけやすくなります。設計上の落とし穴については、エージェントワークフローツール接続：パターンと落とし穴も参考になります。

M3へのアクセス方法

現時点でMiniMax M3には、主に2つのアクセス方法があります。

サブスクリプショントークンプラン
API

サブスクリプショントークンプランには、月額のトークン許容量が含まれます。

プログラムから利用する場合は、OpenAIスタイルのチャット補完インターフェースを使います。

基本情報は次の通りです。

Base URL: https://api.minimax.io/v1
Endpoint: POST /chat/completions
Model ID: MiniMax-M3
Auth: Bearer token

HTTPリクエストの例です。

POST https://api.minimax.io/v1/chat/completions
Authorization: Bearer $API_KEY
Content-Type: application/json

実装時は、次のような流れで進めると安全です。

MiniMaxでAPIキーを取得する
最小プロンプトで疎通確認する
レスポンス構造を確認する
エラー時のレスポンスを確認する
ツール呼び出しやJSON出力をスキーマ検証する
長文コンテキスト入力時のコストとレイテンシを測る

公式の完全なスキーマはMiniMax APIリファレンスで確認できます。

料金面では、次の2点に注意が必要です。

入力が512Kトークン以下の場合は標準料金
512Kトークンを超える場合は長文コンテキスト料金
サービスティアは標準と優先の2種類

MiniMaxはトークンあたりの正確な価格を公開していないため、本格導入前に最新の料金ドキュメントを確認してください。

ステップバイステップのセットアップは、MiniMax M3 APIの利用方法で確認できます。料金をかけずに試したい場合は、MiniMax M3を無料で利用する方法も参考になります。APIキーを取得したら、アプリケーションに組み込む前にApidogをダウンロードして最初のリクエストを送信し、応答形式を確認するとよいでしょう。

他のオープンウェイトモデルとの比較

M3は、DeepSeek V4-pro、Qwen 3.7、Kimi k2.6、GLM-5.1など、多くのオープンウェイトモデルが競争する領域に入ってきました。これらのモデルは、それぞれコーディング、推論、多言語処理などで強みを持っています。

M3の差別化ポイントは、単一のベンチマークスコアではなく、次の組み合わせです。

フロンティアレベルを目指すコーディング能力
最大1,000,000トークンのコンテキスト
画像・ビデオ・デスクトップ操作を含むマルチモダリティ
オープンウェイトとして公開予定

ただし、技術レポートとウェイトはまだ公開前です。最終的な評価には、独立したベンチマークと実運用での検証が必要です。既に他のオープンモデルを使っている場合、Qwen 3.7の概要は比較対象を理解する上で役立ちます。

FAQ

MiniMax M3はオープンソースですか？

M3はオープンウェイトモデルです。MiniMaxは、2026年6月1日のリリースから約10日以内にモデルウェイトと技術レポートを公開するとしています。執筆時点では、まだウェイトは公開されていないため、すぐにダウンロードして自己ホストすることはできません。

コンテキストウィンドウはどれくらいですか？

最大1,000,000トークンです。MSAアーキテクチャにより、トークンあたりの計算量が前世代モデルの約1/20に削減されるとされています。

MiniMax M3は無料ですか？

直接的には無料ではありません。MiniMaxは月額20ドルからのサブスクリプショントークンプランと、トークン単位で課金されるAPIアクセスを提供しています。MiniMax自体から公式の無料ティアは発表されていませんが、MiniMax M3を無料で利用する方法では利用可能な無料ルートが紹介されています。

M3はClaude Opus 4.7とどう比較されますか？

MiniMaxが報告したベンチマークでは、M3はSWE-Bench Proで59.0%を記録し、Opus 4.7に近い結果を出しています。また、SVG-BenchではOpus 4.7を上回る一方、PostTrainBenchでは0.37対0.42で下回っています。これらはベンダー提供値であるため、独立した評価を待つ必要があります。

ウェイトはいつ公開されますか？

MiniMaxは、2026年6月1日のリリースから約10日以内に、オープンウェイトと技術レポートの両方を公開するとしています。技術レポートでは、未公開のパラメーター数も補足される見込みです。

M3は画像やビデオを扱えますか？

はい。M3はネイティブなマルチモダリティを備えており、画像とビデオの入力を受け付けます。さらに、画面内容を理解するだけでなく、デスクトップアプリケーションを直接操作する能力も示されています。

要約

MiniMax M3は、コーディング能力、100万トークンのコンテキストウィンドウ、ネイティブなマルチモダリティを1つにまとめたオープンウェイトモデルです。MSAにより長文コンテキストの推論コストを抑え、MiniMax報告のSWE-Bench Proスコアではクローズドなフロンティアモデルに近い結果を示しています。

一方で、パラメーター数は未公開であり、ウェイトと技術レポートも公開待ちです。実運用で使う場合は、独立ベンチマーク、APIコスト、レイテンシ、ツール呼び出しの安定性を確認する必要があります。

M3で構築を始めるなら、まずAPIキーを取得し、Apidogで最小リクエスト、レスポンス構造、ツール呼び出しの形式を検証してください。大規模なエージェントワークフローに進む前に、小さなリクエストで挙動を確認するのが安全です。

DEV Community