Rihpig

Posted on Jun 1 • Originally published at apidog.com

MiniMax M3란? 최초의 오픈 웨이트 프론티어 코딩 모델

MiniMax M3는 MiniMax가 2026년 6월 1일에 출시한 오픈 웨이트 AI 모델입니다. 핵심은 세 가지 기능을 하나의 모델에 묶었다는 점입니다: 최첨단 코딩 성능, 최대 1,000,000 토큰 컨텍스트 윈도우, 그리고 이미지·비디오 입력 및 데스크톱 조작을 포함하는 기본 멀티모달 기능입니다.

오늘 Apidog를 사용해 보세요

많은 모델은 이 중 한두 가지에 강점을 보입니다. M3는 이 세 가지를 동시에 제공하는 것을 목표로 하며, MiniMax는 출시 후 약 10일 이내에 오픈 웨이트와 전체 기술 보고서를 공개하겠다고 밝혔습니다. 즉, API로 먼저 테스트한 뒤 이후 자체 호스팅까지 검토할 수 있습니다. Qwen 3.7과 같은 오픈 웨이트 모델 흐름을 보고 있었다면, M3는 다음으로 확인할 만한 주요 진입자입니다. 출시 세부 정보는 MiniMax M3 발표에서 확인할 수 있습니다.

이 글에서는 M3의 특징, MiniMax가 공개한 벤치마크, MSA 아키텍처가 긴 컨텍스트 비용을 줄이는 방식, 실제로 만들 수 있는 애플리케이션, 그리고 API 접근 방법을 정리합니다.

💡 M3를 애플리케이션에 연결하려면 API 응답, 도구 호출, 에이전트 워크플로우를 검증할 수 있어야 합니다. Apidog 같은 도구를 사용하면 요청·응답 구조를 빠르게 확인하고, 프로덕션에 넣기 전에 깨진 스키마를 잡을 수 있습니다.

M3를 차별화하는 요소는 무엇인가요

대부분의 최첨단 모델은 다음 중 하나를 선택하게 만듭니다.

강력한 코딩 성능
매우 긴 컨텍스트 윈도우
이미지, 비디오, 컴퓨터 사용을 포함한 멀티모달 기능

M3의 핵심 주장은 이 세 가지를 하나의 오픈 웨이트 모델에서 동시에 제공한다는 것입니다.

M3의 주요 구성은 다음과 같습니다.

최첨단 코딩: MiniMax는 M3가 코딩 및 에이전트 소프트웨어 벤치마크에서 강력한 비공개 모델과 경쟁하는 수준을 목표로 한다고 설명합니다.
100만 토큰 컨텍스트: 최대 1,000,000 토큰을 한 번에 입력할 수 있습니다. 대규모 코드베이스, 긴 문서 묶음, 긴 채팅 기록을 과도하게 잘라내지 않고 처리할 수 있습니다.
기본 멀티모달 기능: 이미지와 비디오를 입력으로 받고, 데스크톱 컴퓨터를 직접 조작할 수 있습니다. MiniMax는 M3가 로컬 ERP 클라이언트를 열고 송장을 일괄 입력하는 데모를 공개했습니다.

오픈 웨이트는 이 조합의 실용성을 높입니다. 가중치가 공개되면 민감한 데이터를 다루는 워크로드를 자체 인프라에서 실행하거나, 특정 도메인에 맞춰 미세 조정하거나, 호출당 벤더 종속을 줄이는 방식으로 운영할 수 있습니다. 이러한 흐름의 배경은 2026년 중국 LLM 가격 전쟁에서도 확인할 수 있습니다.

중요한 숫자

MiniMax는 M3 출시와 함께 여러 벤치마크 결과를 공개했습니다. 단, 이 수치는 공급업체가 보고한 결과이므로 독립적인 제3자 검증 결과와 구분해서 봐야 합니다.

주목할 점은 SWE-Bench Pro 59.0%입니다. SWE-Bench Pro는 실제 소프트웨어 엔지니어링 작업을 다루는 어렵고 오염에 강한 벤치마크입니다. 자세한 방법론은 SWE-Bench 프로젝트 사이트에서 확인할 수 있습니다.

MiniMax는 M3가 SWE-Bench Pro에서 GPT-5.5와 Gemini 3.1 Pro를 능가하고 Claude Opus 4.7에 근접한다고 보고했습니다. 오픈 웨이트 모델로서는 강한 주장입니다.

다만 모든 지표에서 앞서는 것은 아닙니다. M3는 PostTrainBench에서 0.37점을 기록해 Opus 4.7의 0.42점, GPT-5.5의 0.39점보다 낮습니다. 이런 차이는 독립 벤치마크가 나오기 전까지 반드시 확인해야 할 부분입니다.

아직 공개되지 않은 중요한 정보도 있습니다. MiniMax는 매개변수 개수와 활성 매개변수 수치를 기술 보고서에서 공개할 예정이라고 밝혔습니다. 따라서 현재로서는 정확한 매개변수당 비용 비교를 계산하기 어렵습니다. 비공개 최첨단 모델과의 비교는 MiniMax M3 vs Opus 4.7 vs GPT-5.5를 참고할 수 있습니다.

간단히 설명하는 MSA 아키텍처

M3의 긴 컨텍스트 효율성은 MSA, 즉 MiniMax Sparse Attention에서 나옵니다.

표준 어텐션은 모든 토큰을 다른 모든 토큰과 비교합니다. 컨텍스트가 길어질수록 계산 비용이 빠르게 커지기 때문에, 기존 아키텍처에서 100만 토큰 윈도우는 매우 비쌉니다.

희소 어텐션은 모든 토큰을 전체 시퀀스와 비교하지 않고, 선택된 하위 집합에만 주의를 기울입니다. MiniMax는 이 방식으로 토큰당 컴퓨팅 비용이 이전 세대 모델의 약 1/20 수준으로 줄어든다고 설명합니다.

추론 단계에서의 효과는 다음과 같습니다.

프리필, 즉 프롬프트 읽기: 9배 이상 빠름
디코드, 즉 응답 생성: 15배 이상 빠름

개발자 관점에서 중요한 점은 긴 컨텍스트 작업의 설계 방식이 달라질 수 있다는 것입니다. 기존에는 긴 문서나 대규모 코드베이스를 처리하기 위해 청킹, 임베딩, 검색 파이프라인을 먼저 설계하는 경우가 많았습니다. M3처럼 토큰당 비용이 크게 낮아지면, 일부 작업에서는 전체 저장소나 문서 묶음을 모델에 직접 넣는 방식도 실용적인 선택지가 됩니다.

실제로 만들 수 있는 것

M3는 장시간 실행되는 에이전트 작업을 염두에 둔 모델입니다. MiniMax가 공개한 데모는 다음과 같은 사용 사례를 보여줍니다.

24시간 CUDA 커널 최적화: M3가 자율적으로 커널을 작업해 9.4배 속도 향상을 달성했습니다.
자율 논문 재현: 18개의 커밋을 거쳐 연구 논문을 재현하고 23개의 실험 도표를 생성했습니다.
컴퓨터 사용: 로컬 ERP 클라이언트를 열고 송장을 일괄 입력하는 등 데스크톱 애플리케이션을 직접 조작했습니다.

이 기능을 제품화한 래퍼는 MiniMax Code입니다. 여기에 에이전트 팀 기능이 추가되어 다단계, 동시적, 동적으로 조절 가능한 워크플로우를 구성할 수 있습니다.

특히 실무에서 유용한 패턴은 생산자 + 검증자 구조입니다.

사용자 요청
   ↓
생산자 에이전트: 코드, 패치, 문서, 액션 플랜 생성
   ↓
검증자 에이전트: 결과 검토, 테스트, 정책 확인
   ↓
승인 또는 재작업

이 구조는 단일 패스 에이전트에서 발생하기 쉬운 조용한 실패를 줄이는 데 도움이 됩니다.

M3 위에 에이전트를 구축할 때 어려운 부분은 모델 호출 자체보다 도구 연결입니다. 예를 들어 다음 문제가 자주 발생합니다.

함수 호출 스키마가 변경됨
모델이 잘못된 인수 타입을 반환함
필수 필드가 누락됨
하나의 잘못된 응답이 전체 워크플로우를 중단함

따라서 API 테스트와 응답 검증을 먼저 넣는 것이 좋습니다. M3의 도구 호출 응답을 캡처하고 Apidog에서 구조를 검증하면, 프로덕션 배포 전에 깨진 함수 호출을 잡을 수 있습니다. 에이전트 설계 패턴은 에이전트 워크플로우 도구 연결: 패턴 및 함정에서 더 자세히 다룹니다.

M3에 접근하는 방법

현재 MiniMax는 두 가지 접근 방식을 제공합니다.

구독 토큰 플랜
API

구독 플랜은 월별 토큰 허용량을 묶음으로 제공합니다.

프로그래밍 방식으로 사용하려면 API를 호출하면 됩니다. M3 API는 OpenAI 스타일의 채팅 완성 인터페이스를 사용합니다.

기본 URL: https://api.minimax.io/v1
엔드포인트: POST /chat/completions
모델 ID: MiniMax-M3
인증: Bearer 토큰

기본 요청 형태는 다음과 같습니다.

POST https://api.minimax.io/v1/chat/completions
Authorization: Bearer $API_KEY
Content-Type: application/json

예시 요청은 다음과 같은 형태로 구성할 수 있습니다.

curl https://api.minimax.io/v1/chat/completions \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "MiniMax-M3",
    "messages": [
      {
        "role": "user",
        "content": "이 저장소의 주요 리팩터링 포인트를 요약해줘."
      }
    ]
  }'

raw HTTP, Anthropic SDK, OpenAI SDK를 통해 호출할 수 있습니다. MiniMax는 Anthropic SDK 경로를 권장합니다. 전체 스키마는 공식 MiniMax API 레퍼런스에서 확인할 수 있습니다.

가격과 관련해서는 두 가지를 확인해야 합니다.

입력이 512K 토큰 이하일 때와 512K 토큰 초과일 때 요금이 다릅니다.
서비스 계층은 표준과 우선순위로 나뉩니다.

MiniMax는 토큰당 정확한 가격을 공개하지 않았으므로, 예산을 책정하기 전에 문서에서 현재 요금을 확인해야 합니다.

작동하는 요청을 포함한 단계별 설정은 MiniMax M3 API 사용 방법을 참고하세요. 비용 없이 먼저 테스트하고 싶다면 MiniMax M3를 무료로 사용하는 방법에서 가능한 옵션을 확인할 수 있습니다. API 키를 받은 뒤에는 Apidog를 다운로드해 첫 요청을 보내고, 애플리케이션 코드를 작성하기 전에 응답 형식을 먼저 검사하는 것이 좋습니다.

다른 오픈 웨이트 모델과의 비교

M3는 가격과 기능을 강하게 밀어붙이는 중국 연구소의 오픈 웨이트 모델들과 경쟁합니다. 현재 비교 대상에는 DeepSeek V4-pro, Qwen 3.7, Kimi k2.6, GLM-5.1 등이 있습니다. 각 모델은 코딩, 추론, 다국어 작업에서 서로 다른 강점을 가집니다.

M3의 차별점은 단일 벤치마크 점수가 아니라 번들입니다.

최첨단 코딩
100만 토큰 컨텍스트 윈도우
기본 멀티모달 입력
컴퓨터 사용 기능
오픈 웨이트 공개 예정

가까운 경쟁 모델들은 보통 한 축에서 강점을 보입니다. 반면 M3는 세 가지 주요 축을 동시에 제공하려고 합니다. 다만 기술 보고서와 오픈 웨이트가 아직 공개되지 않았기 때문에, 최종 평가는 독립 벤치마크 이후에 하는 것이 안전합니다.

이미 다른 오픈 모델을 실행 중이라면 Qwen 3.7 개요를 함께 참고하면 M3의 위치를 비교하기 쉽습니다.

자주 묻는 질문

MiniMax M3는 오픈 소스인가요?

오픈 웨이트 모델입니다. MiniMax는 2026년 6월 1일 출시 후 약 10일 이내에 모델 가중치와 기술 보고서를 공개하겠다고 밝혔습니다. 이 글을 쓰는 시점에는 아직 가중치가 공개되지 않았기 때문에 다운로드해 자체 호스팅할 수는 없습니다.

컨텍스트 윈도우는 얼마인가요?

최대 1,000,000 토큰입니다. MSA 아키텍처는 토큰당 컴퓨팅 비용을 이전 세대 모델의 약 1/20 수준으로 줄여, 매우 긴 컨텍스트를 더 경제적으로 사용할 수 있게 합니다.

MiniMax M3는 무료인가요?

직접적으로는 아닙니다. MiniMax는 월 $20부터 시작하는 플러스 구독 토큰 플랜과 토큰 단위로 청구되는 API 접근을 제공합니다. MiniMax 자체적으로 공개된 무료 티어는 없지만, MiniMax M3를 무료로 사용하는 방법에서 사용 가능한 무료 경로를 확인할 수 있습니다.

M3는 Claude Opus 4.7과 어떻게 비교되나요?

MiniMax가 보고한 벤치마크에 따르면 M3는 SWE-Bench Pro에서 59.0%를 기록해 Opus 4.7에 근접하고, SVG-Bench에서는 Opus 4.7을 능가합니다. 하지만 PostTrainBench에서는 0.37점으로 Opus 4.7의 0.42점보다 낮습니다. 공급업체 보고 수치이므로 독립적인 테스트 결과를 기다리는 것이 좋습니다.

가중치는 언제 공개되나요?

MiniMax는 2026년 6월 1일 출시 후 약 10일 이내에 오픈 웨이트와 기술 보고서를 공개하겠다고 밝혔습니다. 기술 보고서에는 아직 공개되지 않은 매개변수 개수도 포함될 것으로 예상됩니다.

M3는 이미지와 비디오를 처리할 수 있나요?

네. M3는 기본적으로 멀티모달 모델이며 이미지와 비디오 입력을 모두 처리합니다. 또한 화면 내용을 설명하는 수준을 넘어 데스크톱 애플리케이션을 직접 조작하는 컴퓨터 사용 기능도 제공합니다.

요약

MiniMax M3는 최첨단 코딩, 100만 토큰 컨텍스트 윈도우, 기본 멀티모달 기능을 하나로 묶은 오픈 웨이트 모델입니다. MSA 아키텍처는 긴 컨텍스트 비용을 줄이고, MiniMax가 보고한 SWE-Bench Pro 점수는 비공개 최첨단 모델에 근접합니다.

다만 아직 확인해야 할 부분도 있습니다.

오픈 웨이트와 기술 보고서 공개 전
매개변수 개수 미공개
일부 벤치마크에서 비공개 모델보다 낮은 점수
독립 벤치마크 필요

M3로 애플리케이션을 만들 계획이라면 먼저 API 키를 받고, 작은 요청부터 테스트하세요. 이후 Apidog에서 첫 호출, 응답 스키마, 도구 호출 구조를 검증한 뒤 워크플로우를 확장하는 것이 안전합니다.

DEV Community