Thanawat Wongchai

Posted on Jun 3 • Originally published at apidog.com

Qwen 3.7 Plus vs Max: ควรเลือกใช้โมเดล Qwen 3.7 ตัวไหนดี

Alibaba ได้เปิดตัวเรือธงสองรุ่นใน Qwen 3.7 series ภายในสองสัปดาห์: Qwen3.7-Max ซึ่งเป็นโมเดลการให้เหตุผลเฉพาะข้อความ และ Qwen3.7-Plus ซึ่งเป็นเวอร์ชันหลายโมดอลที่เพิ่มอินพุตภาพและวิดีโอ พร้อมราคาที่ถูกกว่ามาก ทั้งสองรุ่นมีบริบท 1M โทเค็น และเพดานการทำงานอิสระ 35 ชั่วโมงเท่ากัน ดังนั้นการเลือกใช้งานควรดูจากปริมาณงานจริง ไม่ใช่แค่ตารางสเปก

ลองใช้ Apidog วันนี้

บทความนี้เปรียบเทียบ Qwen 3.7 Plus กับ Qwen 3.7 Max ในมุมที่นำไปใช้ได้จริง: เกณฑ์มาตรฐาน ราคา ความเร็ว และแนวทางเลือกโมเดลสำหรับงาน API/agent ในชีวิตจริง หากต้องการอ่านพื้นฐานของแต่ละโมเดลก่อน ดู ภาพรวมของ Qwen 3.7 Plus และคู่มือ Qwen 3.7 คืออะไร ไม่ว่าคุณจะเลือกรุ่นใด ขั้นตอนสำคัญคือการทดสอบ API request/response ก่อนใช้งานจริง ซึ่งสามารถทำได้ด้วย Apidog

คำตอบสั้นๆ

เลือก Qwen 3.7 Plus เป็นค่าเริ่มต้นสำหรับทีมส่วนใหญ่ เพราะ:

ใช้เครื่องมือได้ใกล้เคียง Max
ทำงาน Terminal-Bench ได้ดีกว่าเล็กน้อย
รองรับข้อความ รูปภาพ และวิดีโอ
ราคาถูกกว่าประมาณหกเท่าสำหรับอินพุต

เลือก Qwen 3.7 Max เฉพาะกรณีที่งานของคุณเป็นข้อความล้วน ต้องการคุณภาพข้อความสูงสุด และให้ความสำคัญกับความหน่วงต่ำในเส้นทางข้อความเท่านั้น เช่น chatbot ที่ผู้ใช้มองเห็นเวลา first token อย่างชัดเจน

ความแตกต่างหลัก

Qwen 3.7 Max คือโมเดลเรือธงเฉพาะข้อความ ใช้สำหรับ reasoning, coding และ agent chain ยาวๆ จากอินพุตข้อความ

Qwen 3.7 Plus ใช้ฐานความสามารถใกล้เคียงกัน แต่เพิ่ม multimodal input:

อ่านรูปภาพ
อ่านวิดีโอ
ใช้ screenshot เพื่อทำ GUI grounding
คืนค่าพิกัดการคลิกจากภาพหน้าจอได้

ดังนั้น trade-off หลักคือ:

ถ้าคุณเลือก	ได้อะไร	เสียอะไร
Plus	วิสัยทัศน์ + ราคาถูกกว่า	คุณภาพข้อความและ latency ตามหลัง Max เล็กน้อย
Max	ข้อความเร็วกว่า/แรงกว่าเล็กน้อย	ไม่มีภาพ/วิดีโอ และราคาแพงกว่า

เกณฑ์มาตรฐาน

ตัวเลขชี้ไปในทิศทางเดียวกัน: Plus ตามหลัง Max เล็กน้อยในข้อความล้วน เสมอในการใช้เครื่องมือ และชนะทันทีเมื่อมีงานภาพหรือ GUI เข้ามาเกี่ยวข้อง

เกณฑ์มาตรฐาน	Qwen 3.7 Plus	Qwen 3.7 Max
LM Arena (ข้อความ)	อันดับที่ 15	อันดับที่ 13
LM Arena (การเขียนโค้ด)	อันดับที่ 12	อันดับที่ 10
Vision Arena	อันดับที่ 16	ใช้ไม่ได้
SWE-Bench Pro	~60%	60.6%
Terminal-Bench (2.0 Terminus)	70.3	69.7
ScreenSpot Pro (GUI grounding)	79.0	ไม่มี
MCP-Atlas (การใช้เครื่องมือ)	76.4	76.4

สิ่งที่ควรนำไปใช้ตัดสินใจ:

1. SWE-Bench Pro แทบจะเสมอกัน

Plus ทำได้ประมาณ 60% ส่วน Max อยู่ที่ 60.6% สำหรับงานซอฟต์แวร์จริง ความสามารถด้านภาพของ Plus ไม่ได้ทำให้ความสามารถด้าน coding ลดลงอย่างมีนัยสำคัญ

ถ้าคุณกำลังเปรียบเทียบกับโมเดลเรือธงอื่น ดู การเปรียบเทียบ Qwen 3.7 vs GPT-5.5 vs Opus 4.7

2. Plus ชนะ Terminal-Bench เล็กน้อย

Plus ได้ 70.3 เทียบกับ Max ที่ 69.7 สำหรับ agent ที่ต้องใช้ shell หรือ terminal บ่อยๆ โมเดลที่ถูกกว่ากลับทำคะแนนได้ดีกว่าเล็กน้อย

3. GUI grounding คือจุดตัดสิน

ScreenSpot Pro ของ Plus อยู่ที่ 79.0 ส่วน Max ไม่รองรับเลย

ถ้า agent ของคุณต้องอ่านข้อความจากหน้าจอ กดปุ่ม เลือกเมนู หรือทำงานกับ UI จาก screenshot ตัวเลือกจริงมีเพียง Plus เท่านั้น

หมายเหตุ: ตัวเลข benchmark ควรใช้เป็นแนวทาง ไม่ใช่ผลลัพธ์รับประกัน เว็บไซต์ SWE-bench อธิบายรายละเอียดของชุดทดสอบแต่ละแบบ

ราคา

จุดต่างที่ใหญ่ที่สุดคือราคา

	Qwen 3.7 Plus	Qwen 3.7 Max
อินพุต / 1M โทเค็น	$0.40	$2.50
เอาต์พุต / 1M โทเค็น	$1.60	$7.50
อินพุตที่แคช / 1M	$0.08	$0.25

สำหรับ workload ที่มีปริมาณมาก เช่น classification, summarization, agent loop หรือ batch processing ราคาเป็นตัวแปรสำคัญมาก

ตัวอย่างวิธีคิดต้นทุนแบบง่าย:

ต้นทุน = (input_tokens / 1,000,000 × input_price)
       + (output_tokens / 1,000,000 × output_price)

ถ้าคุณประมวลผล 100M input tokens และ 20M output tokens:

Plus = (100 × $0.40) + (20 × $1.60)
     = $40 + $32
     = $72

Max = (100 × $2.50) + (20 × $7.50)
    = $250 + $150
    = $400

ในกรณีนี้ Plus ถูกกว่าประมาณ 5.5 เท่า

ข้อควรระวังสำหรับ Plus: รูปภาพและวิดีโอถูกแปลงเป็นโทเค็นและใช้บริบท 1M โทเค็นร่วมกัน ดังนั้นงานที่ส่ง screenshot หรือ video frame จำนวนมากจะมีต้นทุนจริงสูงขึ้น ควร:

ลดขนาดภาพก่อนส่ง
crop เฉพาะส่วน UI ที่สำคัญ
sample video frame เท่าที่จำเป็น
cache prompt/context ที่ใช้ซ้ำ

อ่านเพิ่มเติมได้ที่ การลดต้นทุนโทเค็นของเอเจนต์ และ สงครามราคา LLM ของจีนในปี 2026 ส่วนราคาทางการอยู่ที่ หน้าการกำหนดราคา Model Studio

ข้อมูลจำเพาะและความเร็ว

	Qwen 3.7 Plus	Qwen 3.7 Max
รูปแบบอินพุต	ข้อความ, รูปภาพ, วิดีโอ	ข้อความเท่านั้น
หน้าต่างบริบท	1M ใช้ร่วมกับวิสัยทัศน์	1M
เพดานการทำงานอัตโนมัติ	35 ชั่วโมง	35 ชั่วโมง
ความหน่วงเฉพาะข้อความ	ค่าพื้นฐาน	เร็วขึ้น ~7–15% สำหรับเส้นทางแบบเย็น
น้ำหนักโมเดล	กรรมสิทธิ์, API เท่านั้น	กรรมสิทธิ์, API เท่านั้น

Max มีข้อได้เปรียบด้าน latency ใน cold start เฉพาะข้อความ โดยเร็วกว่า Plus ประมาณ 7–15% ตามเส้นทางการเรียกใช้งานข้อความล้วน

สำหรับ product ที่ผู้ใช้เห็นเวลา first token โดยตรง เช่น live chat หรือ support bot ความต่างนี้อาจมีผล แต่ถ้างานเกี่ยวข้องกับรูปภาพ วิดีโอ หรือ screenshot Plus เป็นตัวเลือกเดียวอยู่ดี

ดูข้อมูลความเร็วเพิ่มเติมได้จาก การวิเคราะห์อิสระ

ทั้งสองรุ่นเป็นโมเดลปิดและใช้งานผ่าน Alibaba Cloud Model Studio เท่านั้น จึงไม่เหมาะหากคุณต้องการ self-host หรือดาวน์โหลด weights มา deploy เอง

คุณควรเลือกรุ่นไหน

เลือก Qwen 3.7 Plus หาก:

งานมีรูปภาพ screenshot PDF หรือวิดีโอ
คุณสร้าง computer-use agent หรือ GUI automation
คุณต้องควบคุมต้นทุน API
คุณทำ batch processing หรือ agent loop จำนวนมาก
คุณต้องการโมเดลเริ่มต้นที่ยืดหยุ่นกว่า

เลือก Qwen 3.7 Max หาก:

งานเป็นข้อความเท่านั้น
คุณ optimize เพื่อคะแนน text/coding benchmark สูงสุด
latency เฉพาะข้อความสำคัญมาก
คุณไม่เคยส่งภาพหรือวิดีโอเข้าโมเดล
คุณยอมจ่ายแพงกว่าเพื่อคุณภาพข้อความเพิ่มเล็กน้อย

สำหรับทีมส่วนใหญ่ Plus เป็น default ที่สมเหตุสมผล ส่วน Max เป็นรุ่นเฉพาะทาง ต้องมีเหตุผลที่ชัดเจนพอสำหรับต้นทุนที่สูงกว่า

Mapping ตาม workload

ปริมาณงาน	เลือก	เหตุผล
QA ภาพหน้าจอ หรือ visual regression agent	Plus	ต้องใช้ GUI grounding และมีเพียง Plus ที่มองเห็นหน้าจอ
สกัดข้อมูลจากใบแจ้งหนี้ ใบเสร็จ หรือ PDF สแกน	Plus	ต้องใช้ image input
จำแนกข้อความปริมาณมาก	Plus	คุณภาพใกล้เคียง แต่ต้นทุนต่ำกว่ามาก
แชทบอท support ที่ต้อง latency ต่ำ	Max	cold start เฉพาะข้อความเร็วกว่า
autonomous coding agent ระยะยาว	ทั้งสอง	SWE-Bench Pro ใกล้กัน ให้ราคาเป็นตัวตัดสิน
agent ที่ใช้ browser หรือ desktop UI	Plus	ต้องอ่านหน้าจอและระบุตำแหน่ง GUI
summarization เอกสารจำนวนมาก	Plus	ถูกกว่า และบริบทใหญ่เท่ากัน

กฎง่ายๆ:

ถ้ามีภาพ / วิดีโอ / screenshot → Plus
ถ้าต้องลดต้นทุน → Plus
ถ้าเป็นข้อความล้วนและ latency สำคัญที่สุด → Max
นอกนั้นเริ่มจาก Plus ก่อน

การทดสอบทั้งสองด้วย Apidog

โมเดลทั้งสองใช้ endpoint ของ Model Studio ที่เข้ากันได้กับ OpenAI ดังนั้นการเปรียบเทียบทำได้โดยเปลี่ยน model เพียงค่าเดียว

ตัวอย่าง payload สำหรับข้อความ:

{
  "model": "qwen3.7-plus",
  "messages": [
    {
      "role": "user",
      "content": "สรุป pull request นี้และระบุ risk ที่ควรทดสอบ"
    }
  ]
}

เปลี่ยนเป็น Max:

{
  "model": "qwen3.7-max",
  "messages": [
    {
      "role": "user",
      "content": "สรุป pull request นี้และระบุ risk ที่ควรทดสอบ"
    }
  ]
}

แนวทางทดสอบที่แนะนำ:

สร้าง request เดียวกันสองชุด
เปลี่ยนเฉพาะค่า model
ใช้ prompt และ input เดียวกัน
เก็บ response ดิบ
เทียบ latency, token usage, correctness และ cost
เลือกโมเดลจากผลทดสอบจริงของ workload คุณ

Apidog เหมาะกับลูปนี้เพราะคุณสามารถ:

ส่ง request ไปยังทั้ง Plus และ Max
ตรวจ JSON response แบบ raw
จัดการ Model Studio API key ตาม environment
mock endpoint เพื่อให้ frontend/backend ทำงานต่อได้
debug tool-call sequence ของ agent

สำหรับ request แบบ multimodal ของ Plus ดู คู่มือ API ของ Qwen 3.7 Plus ส่วนเส้นทางข้อความพื้นฐานดู คู่มือ API พื้นฐานของ Qwen 3.7

ถ้าโมเดลกำลังเชื่อมหลาย tool call ใน agent workflow ดู ตัวดีบักเอเจนต์ AI ของ Apidog

ดาวน์โหลด Apidog เพื่อทดสอบและเปรียบเทียบ Qwen 3.7 Plus กับ Max ก่อน deploy จริง

คำถามที่พบบ่อย

Qwen 3.7 Plus ดีกว่า Max หรือไม่?

สำหรับ workload ส่วนใหญ่ ใช่ เพราะ Plus เพิ่มความสามารถด้านภาพและวิดีโอ พร้อมราคาที่ถูกกว่ามาก ขณะที่ coding และ tool use ใกล้เคียง Max อย่างไรก็ตาม Max ยังนำเล็กน้อยใน benchmark เฉพาะข้อความและ latency ข้อความ

Plus ถูกกว่าแค่ไหน?

ถูกกว่าประมาณหกเท่าสำหรับอินพุต:

Plus: $0.40 / 1M input tokens
Max:  $2.50 / 1M input tokens

และถูกกว่าเกือบห้าเท่าสำหรับเอาต์พุต:

Plus: $1.60 / 1M output tokens
Max:  $7.50 / 1M output tokens

ทั้งสองใช้ context window เดียวกันหรือไม่?

ใช่ ทั้งสองมีหน้าต่างบริบท 1M โทเค็น แต่สำหรับ Plus รูปภาพและวิดีโอจะใช้โทเค็นจากงบประมาณเดียวกัน

Max ประมวลผลรูปภาพได้หรือไม่?

ไม่ได้ Max เป็นโมเดลข้อความเท่านั้น หากต้องการ image หรือ video input ต้องใช้ Plus

ทั้งสองเป็นโอเพนซอร์สหรือไม่?

ไม่ใช่ ทั้งสองเป็นโมเดลกรรมสิทธิ์และทำงานผ่าน Alibaba Cloud Model Studio เท่านั้น ไม่สามารถดาวน์โหลดหรือ self-host weights ได้

รุ่นไหนเร็วกว่ากัน?

Max เร็วกว่าประมาณ 7–15% ในเส้นทาง cold start เฉพาะข้อความ แต่ถ้า workload มีภาพ วิดีโอ หรือ GUI Plus เป็นตัวเลือกเดียว

สรุป

Qwen 3.7 Max และ Qwen 3.7 Plus เหมาะกับโจทย์ต่างกัน Max เป็นตัวเลือกเฉพาะทางสำหรับข้อความล้วนที่ต้องการ latency และคุณภาพข้อความสูงสุด ส่วน Plus เป็นค่าเริ่มต้นที่เหมาะกับทีมส่วนใหญ่ เพราะรองรับ multimodal และต้นทุนต่ำกว่ามาก

เริ่มจาก Plus ก่อน แล้วค่อยเปลี่ยนเป็น Max เฉพาะเมื่อผลทดสอบจริงพิสูจน์ว่าความเร็วหรือคุณภาพข้อความที่เพิ่มขึ้นคุ้มกับราคาที่สูงกว่า ไม่ว่าจะเลือกรุ่นใด ควรทดสอบ API request/response ใน Apidog ก่อนนำไปใช้งานจริง

DEV Community