DeepSeek V4 เปิดตัวทางการกลางเดือนกรกฎาคม — ขึ้นราคา API ช่วงพีคเท่าตัว

#ai #deepseek #llm #china

DeepSeek V4 เปิดตัวทางการกลางเดือนกรกฎาคม — ขึ้นราคา API ช่วงพีคเท่าตัว

โดย Nokka (นก-กา) | 1 กรกฎาคม 2026

สรุปข่าว

DeepSeek ประกาศเปิดตัว DeepSeek V4 เวอร์ชันทางการกลางเดือนกรกฎาคมนี้ พร้อมกับการเปลี่ยนแปลงราคา API ครั้งใหญ่ บริษัทนำระบบคิดค่าใช้จ่ายแบบ Peak/Off-Peak มาใช้เป็นครั้งแรกในวงการ LLM โดยช่วงเวลาเร่งด่วน (9:00-12:00 น. และ 14:00-18:00 น. ตามเวลาปักกิ่ง) ราคา API จะสูงขึ้นเป็น 2 เท่าของราคาปกติ

นี่เป็นครั้งแรกที่ผู้ให้บริการ LLM รายใหญ่ใช้ระบบคิดราคาแบบนี้

รายละเอียดราคา

ราคาช่วงปกติ (Off-Peak) จะยังคงเท่าเดิมกับที่ DeepSeek V4 ประกาศไว้ แต่ช่วง Peak จะถูกคิดเป็น 2 เท่า ยกตัวอย่าง DeepSeek V4 Pro:

รายการ	Off-Peak (ราคาปกติ)	Peak (x2)
Input (Cache Hit)	0.025 หยวน/ล้าน tokens	0.05 หยวน/ล้าน tokens
Input (Cache Miss)	3 หยวน/ล้าน tokens	6 หยวน/ล้าน tokens
Output	6 หยวน/ล้าน tokens	12 หยวน/ล้าน tokens

สำหรับ DeepSeek V4 Flash ราคา Peak จะอยู่ที่ 0.04 หยวน (Cache Hit), 2 หยวน (Cache Miss) และ 4 หยวน (Output) ต่อล้าน tokens [1]

เปรียบเทียบกับคู่แข่ง

ถ้าเทียบกับ OpenAI GPT-4o ที่คิดราคา 2.5 ดอลลาร์/ล้าน tokens (input) และ 10 ดอลลาร์/ล้าน tokens (output) หรือ Claude Opus 4.8 ที่ 5 ดอลลาร์/ล้าน tokens (input) และ 25 ดอลลาร์/ล้าน tokens (output) [4] DeepSeek V4 Pro ยังถูกกว่าอยู่มากแม้ในช่วง Peak ก็ตาม

ตัวอย่างการคำนวณ

สมมติว่าคุณใช้ DeepSeek V4 Pro สำหรับทำ chatbot ให้ลูกค้า วันหนึ่งมี 100,000 requests แต่ละ request ใช้ input 2,000 tokens และ output 500 tokens ถ้าทำในช่วง Peak คุณจะจ่าย 18 หยวน/ล้าน tokens รวม 100,000 requests = 1,800 หยวน (~9,000 บาท) แต่ถ้าย้ายไปทำช่วง Off-Peak จะเหลือ 900 หยวน (~4,500 บาท) ประหยัดไปครึ่งหนึ่ง

ทำไม DeepSeek ถึงเปลี่ยนมาใช้ระบบนี้?

การเปลี่ยนแปลงนี้สะท้อนให้เห็นว่า AI inference เริ่มถูกมองเป็นทรัพยากรคล้ายกับไฟฟ้าหรือคลาวด์คอมพิวติ้ง ที่ต้นทุนผันแปรตามช่วงเวลาการใช้งาน ยิ่งมีคนเรียกใช้พร้อมกันมาก ต้นทุนต่อหน่วยก็ยิ่งสูง นี่คือแนวคิดเรื่อง dynamic resource management ที่กำลังเข้ามาสู่วงการ AI

ในมุมมองของผม นี่เป็นสัญญาณว่า AI API กำลังก้าวจากยุค "ราคาเดียวตลอดกาล" สู่ยุค "บริหารทรัพยากรแบบอัจฉริยะ" เหมือนกับที่ AWS, Azure, Google Cloud ทำมานานแล้ว คือคิดราคาตามดีมานด์เพื่อกระจายโหลด

DeepSeek ให้เหตุผลว่าการปรับราคานี้จะช่วยรักษาเสถียรภาพของบริการ และจูงใจให้ผู้ใช้ย้ายงานที่ไม่เร่งด่วนไปทำในช่วง Off-Peak ซึ่งจะช่วยลด congestion โดยรวม [2]

DeepSeek V4 เวอร์ชันทางการมีอะไรใหม่?

DeepSeek V4 เปิดตัวในเวอร์ชัน Preview ตั้งแต่เดือนเมษายน 2026 และกลายเป็นโมเดลที่ถูกเรียกใช้ผ่าน API มากที่สุดในโลกบน OpenRouter ติดต่อกัน 6 สัปดาห์ ความนิยมระดับนี้ย่อมสร้างแรงกดดันด้านต้นทุนการให้บริการ [3]

เวอร์ชันทางการที่จะปล่อยกลางเดือนกรกฎาคมนี้มาพร้อมกับ:

กลไก Attention แบบใหม่ที่ทำงานในระดับ token compression รวมกับ DeepSeek Sparse Attention (DSA) ช่วยลดการใช้ compute และ memory เมื่อเทียบกับแนวทางเดิม
1 ล้าน token context window เป็นมาตรฐานในทุกระดับบริการ
ประสิทธิภาพที่ดีขึ้นในด้าน agent-based task execution, mathematical reasoning และ code generation [4]

ปฏิกิริยาจากนักพัฒนา

ข่าวนี้สร้างความฮือฮาในหมู่นักพัฒนา โดยเฉพาะบน Weibo และ Zhihu มีทั้งคนที่เข้าใจเหตุผลและคนที่กังวลว่าต้นทุนจะสูงขึ้น โดยเฉพาะสตาร์ทอัพที่พึ่งพา DeepSeek API ในการให้บริการ

ผู้ใช้รายหนึ่งเปรียบเทียบว่า "tokens กำลังกลายเป็นเหมือนไฟฟ้า ทรัพยากรที่แพงขึ้นในช่วงที่คนใช้เยอะ และถูกลงในช่วงที่คนใช้น้อย" [3]

แต่ก็มีมุมมองที่แตกต่าง นักพัฒนาบางส่วนมองว่านี่เป็นกลยุทธ์ทางธุรกิจที่สมเหตุสมผล เพราะ DeepSeek ต้องแบกรับต้นทุน GPU ที่สูง โดยเฉพาะในช่วงที่โมเดลได้รับความนิยมสูงสุด การคิดราคาแบบ Peak/Off-Peak ช่วยให้ DeepSeek บริหารทรัพยากรได้มีประสิทธิภาพมากขึ้น โดยไม่ต้องลดคุณภาพบริการ ยอมรับว่าการเปลี่ยนแปลงนี้เป็นเรื่องธรรมชาติของตลาดที่กำลังเติบโต

ฝั่งที่ไม่เห็นด้วยมองว่าการขึ้นราคาแบบนี้อาจผลักดันให้นักพัฒนาเริ่มมองหาทางเลือกอื่น เช่น การใช้โมเดล open source มา deploy เอง หรือหันไปใช้ผู้ให้บริการรายอื่นที่ยังไม่มีระบบ Peak pricing ซึ่งก็เป็นความเสี่ยงที่ DeepSeek ต้องบริหารจัดการเช่นกัน เปลี่ยนพฤติกรรมผู้ใช้ไม่ใช่เรื่องง่าย โดยเฉพาะเมื่อมีคู่แข่งรออยู่

DeepSeek ยืนยันว่าจะแจ้งให้ผู้ใช้ทราบล่วงหน้า 24 ชั่วโมงก่อนการเปลี่ยนแปลงราคามีผลบังคับใช้ [4]

มุมมองของ Nokka

ในมุมมองของผม การเปลี่ยนแปลงนี้เป็นเรื่องที่คาดเดาได้ไม่ยาก เมื่อ DeepSeek V4 กลายเป็นโมเดลที่ถูกเรียกใช้มากที่สุดในโลก ต้นทุนการให้บริการย่อมสูงตามไปด้วย โดยเฉพาะในช่วงเวลาที่ผู้ใช้พร้อมกันจำนวนมาก

DeepSeek เลือกใช้แนวทางที่น่าสนใจ คือ "จูงใจ" มากกว่า "จำกัด" แทนที่จะลดคุณภาพบริการหรือจำกัดจำนวน request กลับใช้กลไกราคาเพื่อกระจายโหลด ซึ่งเป็นแนวทางที่โปร่งใสและยุติธรรมกว่า

สำหรับนักพัฒนาไทยที่ใช้ DeepSeek API อยู่ ช่วงเวลา Peak ของจีน (9:00-12:00 และ 14:00-18:00 ตามเวลาปักกิ่ง) ตรงกับช่วง 8:00-11:00 และ 13:00-17:00 ตามเวลาไทย ซึ่งเป็นช่วงทำงานพอดี

ถ้าเป็นไปได้ ลองพิจารณาย้ายงาน batch processing หรือ non-real-time tasks ไปทำนอกช่วงเวลานี้ เพื่อประหยัดค่าใช้จ่าย เริ่มจากวิเคราะห์รูปแบบการใช้งานของคุณก่อน

อีกทางเลือกคือใช้ DeepSeek V4 Flash แทน V4 Pro ถ้างานของคุณไม่ต้องการความแม่นยำสูงสุด เพราะ Flash มีราคาถูกกว่าเกือบ 3 เท่า และยังมีประสิทธิภาพที่ดีในงานทั่วไป

หรือถ้าต้องการควบคุมต้นทุนให้แน่นอน ลองศึกษาโมเดล open source อย่าง Qwen, Yi, หรือ DeepSeek รุ่นเก่า มา deploy เองบน cloud ของไทย ซึ่งอาจคุ้มค่ากว่าในระยะยาวถ้ามีปริมาณการใช้งานสูง ควรเริ่มวางแผนการใช้งานล่วงหน้าก่อนที่ระบบ Peak pricing จะมีผล