DEV Community

Cover image for วิธีใช้ MiniMax M3 API
Thanawat Wongchai
Thanawat Wongchai

Posted on • Originally published at apidog.com

วิธีใช้ MiniMax M3 API

MiniMax M3 เป็นโมเดลการให้เหตุผลและการเขียนโค้ดที่รองรับ Context Window สูงสุด 1,000,000 โทเคน เหมาะกับงานที่ต้องป้อนข้อมูลจำนวนมาก เช่น Repository ทั้งชุด, Log หลายวัน, หรือเอกสารออกแบบขนาดยาว แล้วให้โมเดลวิเคราะห์ในการเรียกใช้ครั้งเดียว หากต้องการเข้าใจภาพรวมของโมเดลก่อนเริ่มใช้งาน อ่าน MiniMax M3 คืออะไร

ลองใช้ Apidog วันนี้

คู่มือนี้เน้นการใช้งานจริง: สร้าง API Key, ส่ง Request แรกด้วย Curl, Python และ Node.js, เปิด/ปิด Reasoning, ใช้งาน Context ขนาดใหญ่ และทดสอบทุกขั้นตอนใน Apidog เพื่อดู Request/Response ดิบก่อนนำไปฝังในแอป หากต้องการทำตาม ให้ ดาวน์โหลด Apidog

เอกสารอ้างอิงอย่างเป็นทางการ: เอกสาร API ของ MiniMax

MiniMax M3 API

สิ่งที่คุณต้องมี

  • บัญชี MiniMax ที่ platform.minimax.io
  • API Key
  • วิธีการชำระเงิน: Pay-as-you-go credit หรือแผน Token แบบ Subscription
  • สำหรับตัวอย่าง SDK:
    • Python 3.8+
    • Node.js 18+

สำหรับ Curl ไม่ต้องติดตั้งอะไรเพิ่มเติมนอกจาก curl


ขั้นตอนที่ 1: สร้าง API Key

เข้าสู่ระบบที่ platform.minimax.io แล้วไปที่ส่วน API Keys เพื่อสร้าง Key ใหม่

MiniMax มี Key สองประเภท:

ประเภท Key ใช้กับ หมายเหตุ
API Key ทั่วไป Pay-as-you-go balance หักจากยอดคงเหลือ
Subscription Key Plus, Max, Ultra plan ใช้เครดิตโทเคนจากแผน หากเครดิตหมด การเรียกใช้จะหยุดจนกว่าจะต่ออายุหรือเปลี่ยน Key

หลังจากสร้าง Key แล้ว ให้คัดลอกและเก็บไว้ทันที เพราะคุณอาจไม่เห็น Key นี้อีก

อย่าใส่ API Key ตรง ๆ ใน Source Code ให้ใช้ Environment Variable แทน:

export MINIMAX_API_KEY="your-key-here"
Enter fullscreen mode Exit fullscreen mode

วิธีนี้ช่วยลดความเสี่ยงที่ Key จะหลุดเข้า Git History, Log หรือไฟล์ที่แชร์กับทีม หากคุณทำงานกับ API Key ใน Editor อ่านเพิ่มเติมได้ที่ ความปลอดภัยของ API Key ในส่วนขยาย VS Code


ขั้นตอนที่ 2: ส่ง Request แรก

MiniMax M3 ใช้ Endpoint นี้:

POST https://api.minimax.io/v1/chat/completions
Enter fullscreen mode Exit fullscreen mode

ค่าหลักที่ต้องใช้:

Base URL: https://api.minimax.io/v1
Model ID: MiniMax-M3
Auth: Authorization: Bearer $MINIMAX_API_KEY
Enter fullscreen mode Exit fullscreen mode

เรียกด้วย Curl

ตัวอย่างสั้นที่สุดสำหรับทดสอบว่า Key และ Endpoint ใช้งานได้:

curl https://api.minimax.io/v1/chat/completions \
  -H "Authorization: Bearer $MINIMAX_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "MiniMax-M3",
    "messages": [
      {
        "role": "user",
        "content": "Refactor this function to be async."
      }
    ]
  }'
Enter fullscreen mode Exit fullscreen mode

ถ้า API Key ถูกต้อง คุณจะได้ Response JSON ที่มีคำตอบของโมเดลอยู่ใน choices[0].message.content


ขั้นตอนที่ 3: เรียก MiniMax M3 ด้วย OpenAI SDK

MiniMax รองรับรูปแบบ API ที่ใช้งานกับ OpenAI SDK ได้ จุดที่ต้องเปลี่ยนคือ base_url

Python

from openai import OpenAI
import os

client = OpenAI(
    base_url="https://api.minimax.io/v1",
    api_key=os.environ["MINIMAX_API_KEY"],
)

response = client.chat.completions.create(
    model="MiniMax-M3",
    messages=[
        {
            "role": "user",
            "content": "Refactor this function to be async."
        }
    ],
)

print(response.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

Node.js

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.minimax.io/v1",
  apiKey: process.env.MINIMAX_API_KEY,
});

const response = await client.chat.completions.create({
  model: "MiniMax-M3",
  messages: [
    {
      role: "user",
      content: "Refactor this function to be async.",
    },
  ],
});

console.log(response.choices[0].message.content);
Enter fullscreen mode Exit fullscreen mode

MiniMax แนะนำ Anthropic SDK ด้วยเช่นกัน แต่ Raw HTTP, OpenAI SDK และ Anthropic SDK สามารถเรียก Endpoint เดียวกันได้ หากคุณเคยใช้ Qwen 3.7 API รูปแบบนี้จะคุ้นเคย เพราะโมเดลสมัยใหม่จำนวนมากรองรับ API Surface ที่คล้าย OpenAI

เอกสาร SDK:


ขั้นตอนที่ 4: ทดสอบ Request ใน Apidog

ก่อนฝัง API ลงในแอปจริง ควรทดสอบ Request และดู Response ดิบก่อนใน Apidog

ทดสอบ MiniMax M3 ใน Apidog

ทำตามขั้นตอนนี้:

  1. สร้าง HTTP Request ใหม่
  2. ตั้ง Method เป็น POST
  3. ใส่ URL:
https://api.minimax.io/v1/chat/completions
Enter fullscreen mode Exit fullscreen mode
  1. เปิด Environments แล้วเพิ่มตัวแปร:
MINIMAX_API_KEY = your-key-here
Enter fullscreen mode Exit fullscreen mode
  1. เพิ่ม Header:
Authorization: Bearer {{MINIMAX_API_KEY}}
Content-Type: application/json
Enter fullscreen mode Exit fullscreen mode
  1. ตั้ง Body เป็น Raw JSON:
{
  "model": "MiniMax-M3",
  "messages": [
    {
      "role": "user",
      "content": "Refactor this function to be async."
    }
  ]
}
Enter fullscreen mode Exit fullscreen mode
  1. กด Send แล้วตรวจสอบ Response

[ภาพหน้าจอ: คำขอและคำตอบของ MiniMax-M3 ใน Apidog]

การเก็บ Token เป็น Environment Variable ช่วยให้แชร์ Request กับทีมได้โดยไม่เปิดเผยข้อมูลลับ และสามารถสลับระหว่าง Pay-as-you-go Key กับ Subscription Key ได้ด้วยการเปลี่ยนค่าตัวแปรเดียว

หากเปิด Streaming ในภายหลัง Apidog จะแสดง Server-sent Events ที่ส่งกลับมา ทำให้ตรวจรูปแบบ Stream ได้ก่อนเขียน Parser ในโค้ดจริง


ขั้นตอนที่ 5: เปิดหรือปิด Reasoning

MiniMax M3 เป็นโมเดล Reasoning โดยค่าเริ่มต้นจะส่งกลับเฉพาะคำตอบสุดท้าย แต่คุณสามารถขอให้แยกข้อมูล Reasoning ออกมาได้ด้วย reasoning_split

Python ตัวอย่าง Reasoning

from openai import OpenAI
import os

client = OpenAI(
    base_url="https://api.minimax.io/v1",
    api_key=os.environ["MINIMAX_API_KEY"],
)

response = client.chat.completions.create(
    model="MiniMax-M3",
    messages=[
        {
            "role": "user",
            "content": "Refactor this function to be async."
        }
    ],
    extra_body={
        "reasoning_split": True
    },
)

print(response.choices[0].message.reasoning_details[0]["text"])  # reasoning
print(response.choices[0].message.content)                       # final answer
Enter fullscreen mode Exit fullscreen mode

เมื่อเปิด reasoning_split:

  • Reasoning อยู่ที่:
response.choices[0].message.reasoning_details[0]["text"]
Enter fullscreen mode Exit fullscreen mode
  • คำตอบสุดท้ายอยู่ที่:
response.choices[0].message.content
Enter fullscreen mode Exit fullscreen mode

แนวทางใช้งาน:

กรณี ควรเปิด Reasoning หรือไม่
Refactor หลายขั้นตอน เปิด
วิเคราะห์ Bug ซับซ้อน เปิด
ตรวจสอบเหตุผลของโมเดล เปิด
งานง่าย เช่น Rewrite ข้อความสั้น ปิด
งานที่ Sensitive ต่อ Latency ปิด
ต้องการลดค่าใช้จ่าย Token ปิด

แยก Reasoning ออกจากคำตอบใน UI ของคุณ เช่น แสดงเฉพาะ Final Answer ให้ผู้ใช้ แต่เก็บ Reasoning ไว้ใน Log หรือระบบ Review


ขั้นตอนที่ 6: ใช้ Context Window ขนาด 1M Token

จุดเด่นของ M3 คือ Context Window ขนาดใหญ่ คุณสามารถส่ง Log หรือไฟล์จำนวนมากเข้าไปใน Prompt เดียวได้

ตัวอย่างวิเคราะห์ Production Log:

from openai import OpenAI
import os

client = OpenAI(
    base_url="https://api.minimax.io/v1",
    api_key=os.environ["MINIMAX_API_KEY"],
)

with open("production-2026-05-30.log") as f:
    log_text = f.read()

response = client.chat.completions.create(
    model="MiniMax-M3",
    messages=[
        {
            "role": "user",
            "content": (
                "Find the root cause of the 502 spike at 14:20 UTC.\n\n"
                f"{log_text}"
            ),
        }
    ],
)

print(response.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

ข้อควรระวังด้านค่าใช้จ่าย:

  • Input Token ≤ 512K ใช้อัตรามาตรฐาน
  • Input Token > 512K ใช้อัตรา Long-Context ที่สูงกว่า

ดังนั้น Prompt 400K token กับ 600K token ไม่ได้ต่างกันแบบ Linear เสมอ เพราะ 600K ข้าม Threshold 512K แล้ว

แนวทางปฏิบัติ:

  • อย่าส่ง Context ขนาดใหญ่โดยไม่จำเป็น
  • ตัดเฉพาะไฟล์หรือ Log ที่เกี่ยวข้อง
  • ใน Agent Loop ให้ Trim Context ทุกครั้งก่อนเรียก API
  • สรุปข้อมูลระหว่างรอบ แทนการส่ง History ทั้งหมดซ้ำ

อ่านเพิ่มเติม: วิธีลดค่าใช้จ่ายโทเคนของ Agent


ขั้นตอนที่ 7: ใช้ Tool Calling

MiniMax M3 รองรับ Tool Calling จึงสามารถใช้สร้าง Agent ที่เรียกฟังก์ชันภายนอก เช่น Run test, Query database หรือเรียก Internal API ได้

ตัวอย่างประกาศ Tool:

tools = [
    {
        "type": "function",
        "function": {
            "name": "run_tests",
            "description": "Run the test suite for a given module path.",
            "parameters": {
                "type": "object",
                "properties": {
                    "module": {
                        "type": "string"
                    }
                },
                "required": ["module"],
            },
        },
    }
]

response = client.chat.completions.create(
    model="MiniMax-M3",
    messages=[
        {
            "role": "user",
            "content": "Fix the failing test in auth/session.py and confirm it passes."
        }
    ],
    tools=tools,
)
Enter fullscreen mode Exit fullscreen mode

เมื่อโมเดลต้องการเรียก Tool Response จะมี tool_calls กลับมา จากนั้นโค้ดของคุณต้อง:

  1. อ่าน tool_calls
  2. Map ชื่อ Tool ไปยังฟังก์ชันจริงในระบบ
  3. Execute ฟังก์ชันนั้น
  4. ส่งผลลัพธ์กลับเข้า API เป็น Message ประเภท tool
  5. เรียก API อีกครั้งเพื่อให้โมเดลดำเนินงานต่อ

Bug ใน Agent จำนวนมากเกิดจากขั้นตอน Handshake ระหว่าง Model ↔ Tool ↔ Model อ่านแนวทางเพิ่มเติมได้ที่ การเชื่อมต่อเครื่องมือใน Workflow แบบ Agentic

ใน Apidog คุณสามารถบันทึกแต่ละ Request ของ Multi-turn Flow แยกกัน เช่น:

  • Initial request
  • Response ที่มี Tool call
  • Request ที่ส่ง Tool result กลับไป
  • Final response

วิธีนี้ช่วย Debug ได้ง่ายกว่าไล่ดู Agent Runtime ภายในอย่างเดียว


ขั้นตอนที่ 8: ใช้ Input แบบ Multimodal

M3 รองรับ Input แบบ Multimodal ดังนั้นนอกจากข้อความแล้ว ยังสามารถส่งรูปภาพร่วมกับ Prompt ได้ด้วย

รูปแบบทั่วไปคือส่ง Content เป็น Array ที่มีหลาย Part เช่น Text และ Image โดยควรอ้างอิงชื่อ Field ล่าสุดจาก เอกสาร API ของ MiniMax เพราะรูปแบบ Multimodal มักเปลี่ยนเร็วกว่า Text Endpoint

ใช้กรณีนี้เมื่อคุณต้องการให้โมเดล:

  • อ่าน Screenshot
  • วิเคราะห์ Diagram
  • ตรวจ UI Bug จากภาพ
  • อธิบายข้อมูลจากรูปภาพประกอบ Prompt

ราคาและระดับบริการ

ค่าใช้จ่ายขึ้นอยู่กับ 2 ส่วนหลัก:

  1. แผน Token หรือ Pay-as-you-go
  2. Service Tier

แผน Token

MiniMax มีระดับ Subscription เช่น:

  • Plus: $20
  • Max: $50
  • Ultra: $120

แต่ละแผนให้เครดิตโทเคนจำนวนต่างกัน และ Subscription Key จะหักเครดิตจากแผนนั้น ส่วน Pay-as-you-go API Key จะหักจากยอดคงเหลือแทน

MiniMax Pricing

Service Tier

มีสองระดับ:

Tier เหมาะกับ
standard Workload ทั่วไป
priority งานที่ Sensitive ต่อ Latency หรือมี SLA

เมื่อนำมารวมกับ Threshold 512K Token ค่าใช้จ่ายจริงจะขึ้นอยู่กับ:

  • จำนวน Input Token
  • จำนวน Output Token
  • ใช้อัตรา Standard หรือ Long-Context
  • ใช้ Pay-as-you-go หรือ Subscription
  • ใช้ Service Tier แบบ standard หรือ priority

ตรวจราคาล่าสุดได้ที่ หน้า pricing และ model ของ MiniMax และ เอกสาร API


FAQ

มีวิธีทดลองใช้ M3 ฟรีหรือไม่?

มี MiniMax มีหลายวิธีให้ทดลองใช้โมเดลโดยไม่ต้องเริ่มจากแผนเสียเงิน อ่านรายละเอียดได้ที่ วิธีใช้ MiniMax M3 ฟรี

ใช้ SDK อะไรได้บ้าง?

ใช้ได้ 3 วิธีหลัก:

  • Raw HTTP
  • OpenAI SDK
  • Anthropic SDK

MiniMax แนะนำ Anthropic SDK แต่ OpenAI SDK ก็ใช้งานได้โดยเปลี่ยน base_url เป็น:

https://api.minimax.io/v1
Enter fullscreen mode Exit fullscreen mode

Streaming Response ทำอย่างไร?

เพิ่ม stream: true ใน Request Body:

{
  "model": "MiniMax-M3",
  "stream": true,
  "messages": [
    {
      "role": "user",
      "content": "Explain this error log."
    }
  ]
}
Enter fullscreen mode Exit fullscreen mode

API จะส่ง Server-sent Events กลับมา SDK จะเปิด Iterator ให้คุณอ่าน Chunk ที่เข้ามาได้ ควรทดสอบ Stream ใน Apidog ก่อนเขียน Parser จริง

Rate Limit คือเท่าไร?

Rate Limit ขึ้นอยู่กับระดับบัญชีและ Service Tier (standard หรือ priority) หากเจอ Error 429 ให้ใช้ Backoff แล้ว Retry หรือย้าย Traffic ที่ต้องการ Latency ต่ำไปยัง priority

ตัวเลขล่าสุดควรดูจาก Dashboard บัญชีและเอกสาร API

Threshold 512K ส่งผลต่อค่าใช้จ่ายอย่างไร?

ถ้า Input Token ไม่เกิน 512K จะใช้อัตรามาตรฐาน หากเกิน 512K จะใช้อัตรา Long-Context ที่สูงกว่า ควรตัด Prompt ให้เหลือเฉพาะข้อมูลที่จำเป็น โดยเฉพาะใน Agent Loop ที่มีการเรียก API หลายรอบ

Self-host MiniMax M3 ได้หรือไม่?

คู่มือนี้ครอบคลุม Hosted API ซึ่งเป็นวิธีเริ่มต้นที่เร็วที่สุด ส่วนการ Self-host ขึ้นอยู่กับสิ่งที่ MiniMax เปิดเผยสำหรับ M3 ณ เวลานั้น ตรวจสอบสถานะล่าสุดได้ที่ หน้าโมเดล MiniMax M3


สรุป

ตอนนี้คุณมี Workflow พื้นฐานสำหรับใช้งาน MiniMax M3 แล้ว:

  • สร้าง API Key
  • เก็บ Key เป็น Environment Variable
  • เรียก API ด้วย Curl
  • ใช้ OpenAI SDK ใน Python และ Node.js
  • ทดสอบ Request/Response ใน Apidog
  • เปิด Reasoning เมื่อจำเป็น
  • ใช้ Context ขนาดใหญ่โดยระวัง Threshold 512K
  • เริ่มต่อ Tool Calling สำหรับ Agent

วิธีเริ่มที่เร็วที่สุดคือใส่ Endpoint ลงใน Apidog, ตั้ง Authorization ด้วย Environment Variable, ส่ง Prompt สั้น ๆ และอ่าน Response ดิบก่อน เมื่อเข้าใจ Schema แล้ว การนำไปเชื่อมกับโค้ดจริงจะตรงไปตรงมามากขึ้น

Top comments (0)