Thanawat Wongchai

Posted on Apr 24 • Originally published at apidog.com

วิธีใช้ DeepSeek V4 ฟรี

DeepSeek V4 เปิดตัวเมื่อวันที่ 23 เมษายน 2026 และแตกต่างจากเทคโนโลยีชั้นนำส่วนใหญ่ เพราะช่องทางฟรีใช้งานได้จริง แชทบนเว็บอย่างเป็นทางการใช้ V4-Pro โดยไม่ต้องใช้บัตรเครดิต น้ำหนักโมเดลเป็นแบบ MIT-licensed และดาวน์โหลดได้ทันที ผู้รวมบริการอย่าง OpenRouter และ Chutes มักจะเปิดใช้งานฟรีไม่กี่วันหลังโมเดลออก คุณสามารถใช้งาน V4 ในงานจริงได้โดยไม่มีค่าใช้จ่าย ก่อนจะตัดสินใจเติมเงินเข้าบัญชีด้วยซ้ำ

ทดลองใช้ Apidog วันนี้

คู่มือนี้สรุปทุกเส้นทางฟรีที่ยืนยันได้ พร้อมคำแนะนำว่าควรเลือกเส้นทางไหนในแต่ละกรณี และวิธีตั้งค่าคอลเล็กชันที่พร้อมใช้งานจริงใน Apidog เพื่อให้การเปลี่ยนไปใช้แบบจ่ายเงินราบรื่นเมื่อใช้งานเพิ่มขึ้น

สำหรับภาพรวมระดับผลิตภัณฑ์ ดูที่ DeepSeek V4 คืออะไร สำหรับคู่มือ API อย่างละเอียด ดูที่ วิธีการใช้ DeepSeek V4 API

TL;DR (สรุปสั้นๆ)

chat.deepseek.com — แชทบนเว็บฟรีบน V4-Pro, สลับโหมด Think High/Max ได้, ไม่ต้องใช้บัตรเครดิต
โฮสต์โมเดล Hugging Face + GPU ของตัวเอง — MIT license, V4-Flash รันบน H100 2-4 ใบ, V4-Pro ต้องการคลัสเตอร์ใหญ่
OpenRouter และ Chutes — เกตเวย์บุคคลที่สาม, มีโควต้าฟรีสำหรับ DeepSeek ภายในสัปดาห์แรก
Hugging Face Inference Providers — ปลายทางใช้งานร่วมกัน, มี rate limit ใช้ทดลองเบื้องต้นได้
เครดิตทดลอง Kaggle, Colab, RunPod — GPU ฟรีสำหรับรันครั้งเดียว, เหมาะกับการทดสอบ self-hosting
ทุกเส้นทางฟรีมีขีดจำกัด สำหรับงาน production ให้เปลี่ยนไปใช้แบบจ่ายเงินก่อนถึงลิมิต

เส้นทางที่ 1: chat.deepseek.com (เส้นทางฟรีเริ่มต้น)

เส้นทางฟรีที่เร็วและเสถียรที่สุดคือแชท UI อย่างเป็นทางการ V4-Pro เป็นโมเดลหลัก สวิตช์ด้านบนของกล่องข้อความใช้สลับ Non-Think, Think High, Think Max ได้

การตั้งค่า

ไปที่ chat.deepseek.com
ลงชื่อเข้าใช้ด้วย email, Google หรือ WeChat
ตรวจสอบว่าเลือกโมเดล V4-Pro
เริ่มใช้งานได้ทันที

สิ่งที่คุณจะได้รับ

บริบทยาว 1M โทเค็นเต็ม
อัปโหลด PDF, รูป, โค้ด ได้
ค้นหาเว็บในตัว
เลือก Reasoning mode ได้ทั้งสามแบบ
ประวัติแชทและโฟลเดอร์

ลักษณะของขีดจำกัด

ไม่มีระบุจำนวนข้อความสูงสุดต่อวัน บริการฟรีจะถูก rate-limit แบบนุ่มนวลเมื่อโหลดสูง การใช้งานหนักอาจตอบช้า/จัดคิว แต่แทบไม่เคยบล็อกถาวร หากเจอ rate limit บ่อย ควรลดความถี่หรือเปลี่ยนไปใช้ API

งานเหมาะสม: ทดสอบพรอมต์ยาก, ตรวจสอบ repo, รัน Think Max กับไฟล์ยาวๆ งานไม่เหมาะ: ระบบอัตโนมัติ/การรันซ้ำจำนวนมาก

เส้นทางที่ 2: โฮสต์ V4-Flash ด้วยตัวเองบน GPU ของคุณ

V4-Flash เป็นโมเดล MIT-license ที่โฮสต์เองได้จริง ขนาด 284B (13B ที่ active) H100 สองใบรัน FP8 ได้ การ quantize INT4 ใส่บน H100 80GB ใบเดียวได้

ค่าใช้จ่ายคือฮาร์ดแวร์ ไม่ใช่ license ถ้ามี GPU ว่าง นี่คือทางฟรีที่เสถียรสุด เพราะไม่โดน limit หรือปิดบริการได้

ดึงน้ำหนักโมเดล

pip install -U "huggingface_hub[cli]"
huggingface-cli login
huggingface-cli download deepseek-ai/DeepSeek-V4-Flash \
  --local-dir ./models/deepseek-v4-flash

น้ำหนัก ~500GB (FP8) เตรียม disk ให้พอ

ให้บริการด้วย vLLM

pip install "vllm>=0.9.0"

vllm serve deepseek-ai/DeepSeek-V4-Flash \
  --tensor-parallel-size 4 \
  --max-model-len 1048576 \
  --dtype auto \
  --port 8000

เปิดใช้งานแล้ว ชี้ไคลเอนต์ที่รองรับ OpenAI API ไปที่ http://localhost:8000/v1 ใช้รูปแบบเดียวกับ DeepSeek API แบบจ่ายเงิน Apidog รองรับ URL นี้ได้ คอลเล็กชันเดิมใช้ต่อได้เลย

ตรวจสอบความเป็นจริงของฮาร์ดแวร์

รุ่น	การ์ดขั้นต่ำ (FP8)	การ์ดขั้นต่ำ (INT4)	Throughput
V4-Flash	2 × H100 80GB	1 × H100 80GB	50-150 โทเค็น/วินาที
V4-Pro	16 × H100 80GB	8 × H100 80GB	ขึ้นกับคลัสเตอร์

ถ้าไม่มี GPU ว่าง การเช่า GPU มักจะแพ้ API แบบจ่ายเงิน เหมาะสำหรับทีมที่มีเครื่องเองหรือมีข้อบังคับที่ต้องโฮสต์เอง

เส้นทางที่ 3: OpenRouter บริการฟรี

OpenRouter คือเกตเวย์รวมโมเดล open/closed ไว้ใน API เดียว แพลตฟอร์มมักเปิดบริการฟรีสำหรับ DeepSeek ทุกรุ่น (V3-V4 ก็เช่นกัน)

การตั้งค่า

สมัคร openrouter.ai
สร้าง API Key
ดูแคตตาล็อก deepseek/deepseek-v4-pro หรือ deepseek/deepseek-v4-flash รุ่นฟรีจะมี :free ต่อท้าย
เรียกใช้งานด้วย SDK ที่รองรับ OpenAI

from openai import OpenAI

client = OpenAI(
    api_key=OPENROUTER_KEY,
    base_url="https://openrouter.ai/api/v1",
)

response = client.chat.completions.create(
    model="deepseek/deepseek-v4-flash:free",
    messages=[{"role": "user", "content": "Write a Python CLI for semver bumping."}],
)

print(response.choices[0].message.content)

ขีดจำกัด

OpenRouter ฟรีจำกัดร้อยกว่าคำขอต่อวันต่อคีย์ ลด priority เมื่อโหลดสูง เหมาะกับการ prototyping ไม่เหมาะกับ production

เส้นทางที่ 4: Hugging Face Inference Providers

Hugging Face เปิด Inference endpoint ให้ใช้ V4 checkpoint ได้หลังเปิดตัว มี rate limit และ latency ผันผวน แต่ใช้ฟรี

from huggingface_hub import InferenceClient

client = InferenceClient(model="deepseek-ai/DeepSeek-V4-Flash")

response = client.chat_completion(
    messages=[{"role": "user", "content": "Summarize the V4 technical report in 5 bullets."}],
    max_tokens=512,
)

print(response.choices[0].message.content)

HF Token ฟรี ถ้าใช้งานหนักค่อยอัปเกรด Pro (rate limit ผ่อนคลาย ค่าใช้จ่ายน้อยกว่า API official)

เส้นทางที่ 5: เครดิตทดลองบน Colab, Kaggle, RunPod และ Lambda

ผู้ให้บริการ GPU ส่วนใหญ่มีเครดิตทดลอง ใช้อย่างเหมาะสมสามารถทดลอง V4-Flash ฟรีได้

Google Colab: ฟรี T4 เล็กไป, Colab Pro+ ได้ 500 compute units/เดือน ใช้ A100 ทดลอง V4-Flash ได้
Kaggle: GPU ฟรีรายสัปดาห์ (T4/P100) เล็กไปสำหรับ V4-Pro, เพียงพอสำหรับ V4-Flash แบบ quantized บางครั้ง
RunPod: เครดิตทดลอง $10 ใช้ H100 ได้ 2-3 ชม. เปิด vLLM, รัน benchmark แล้วปิดเครื่อง
Lambda: โปรฟรี H100/H200 เป็นครั้งคราว เช็คหน้าสมัคร

ทั้งหมดนี้เหมาะสำหรับเทสต์จบในครั้งเดียว ไม่ใช่ทางฟรีระยะยาว

สร้างคอลเล็กชัน Apidog ที่ไม่ขึ้นกับผู้ให้บริการ

ข้อดีของเส้นทางฟรีหลายแบบ คือสามารถทดสอบพรอมต์เดียวกันกับทุก backend ได้โดยไม่ต้องแก้ไขซ้ำ ขั้นตอน:

ดาวน์โหลด Apidog
สร้างคอลเล็กชันเดียว มี 4 environment: chat (placeholder), deepseek (https://api.deepseek.com/v1), openrouter (https://openrouter.ai/api/v1), self-hosted (http://localhost:8000/v1)
บันทึก request POST ไปที่ {{BASE_URL}}/chat/completions
ตั้งค่าคีย์แต่ละผู้ให้บริการเป็น secret variable เนื้อหา request เดียวกันหมด
สลับ environment เพื่อ A/B test พรอมต์เดียวกันทุก backend

รูปแบบเดียวกับ คอลเล็กชัน GPT-5.5 ฟรี; เครื่องมือเดียว ทุก backend ไม่ต้อง config ซ้ำ

คุณควรเลือกเส้นทางฟรีเส้นทางไหน?

ต้องการ feedback ภายใน 5 นาที — ใช้ chat.deepseek.com
สร้าง prototype — ใช้ OpenRouter ฟรีจนหมดโควต้า จากนั้นเติมเงิน DeepSeek
มี GPU และต้องการ compliance — โฮสต์ V4-Flash เองบน vLLM
ต้องการใช้ฟรีระยะยาว — ไม่มีทางฟรี 100% ทุกบริการฟรีมีลิมิต ใช้ chat.deepseek.com สำหรับงาน interactive เติมเงินเล็กน้อยสำหรับ automation

เมื่อไหร่ที่ควรย้ายออกจากบริการฟรี

ถูก rate-limit เกินวันละ 1 ครั้ง — แปลว่ามีภาระงานมากพอควรมีงบแล้ว
ต้องการ SLA — ฟรีไม่มี SLA, API จ่ายเงินมี
ต้องการ log, monitoring หรือ compliance — API จ่ายเงินมี billing log ชัดเจน, ฟรีไม่มี

ถึงจุดนี้ ให้ย้ายไป API อย่างเป็นทางการ เติมเงินขั้นต่ำ $2 ราคาต่อโทเค็นต่ำสุดในกลุ่ม enterprise

คำถามที่พบบ่อย

chat.deepseek.com ฟรีจริงหรือ? ใช่ ไม่ต้องใช้บัตรเครดิต ไม่มี trial timer บริการนี้ soft-limit แต่ไม่ต้องจ่ายเงิน

ต้องมีบัญชี Hugging Face เพื่อดาวน์โหลดน้ำหนักโมเดลไหม? ทางเทคนิคไม่จำเป็น (repo สาธารณะ) แต่ในทางปฏิบัติจำเป็น เพราะช่วยให้ rate-limit สูงขึ้น

เส้นทางฟรีไหนรัน V4-Pro จริง? chat.deepseek.com รัน V4-Pro เต็ม บริการ OpenRouter ฟรีมักจะเป็น V4-Flash ถ้าต้องการ V4-Pro ฟรี ใช้เว็บแชทดีที่สุด

นำบริการฟรีไปใช้กับ production ได้ไหม? ไม่ควร! ฟรีมี rate limit, ข้อกำหนดเปลี่ยนบ่อย, อาจปิดตัวตอนไหนก็ได้ ถ้าให้บริการลูกค้า ใช้ API แบบจ่ายเงินหรือโฮสต์เอง

โฮสต์เองฟรีจริงไหม? License ฟรี แต่ฮาร์ดแวร์ไม่ฟรี ถ้ามี GPU ว่าง ค่าใช้จ่ายคือค่าไฟ ถ้าเช่า GPU มักแพ้ API แบบจ่ายเงิน

Apidog มีบริการฟรีให้ทดสอบไหม? Apidog ฟรีสำหรับออกแบบ/ทดสอบ API คิดเงินเมื่อใช้ API จ่ายเงินผ่าน Apidog ดังนั้น ใช้ workspace Apidog ฟรีกับ chat.deepseek.com หรือ OpenRouter ได้ ขั้นตอนการทำงานฟรี 100%

DEV Community

วิธีใช้ DeepSeek V4 ฟรี

TL;DR (สรุปสั้นๆ)

เส้นทางที่ 1: chat.deepseek.com (เส้นทางฟรีเริ่มต้น)

การตั้งค่า

สิ่งที่คุณจะได้รับ

ลักษณะของขีดจำกัด

เส้นทางที่ 2: โฮสต์ V4-Flash ด้วยตัวเองบน GPU ของคุณ

ดึงน้ำหนักโมเดล

ให้บริการด้วย vLLM

ตรวจสอบความเป็นจริงของฮาร์ดแวร์

เส้นทางที่ 3: OpenRouter บริการฟรี

การตั้งค่า

ขีดจำกัด

เส้นทางที่ 4: Hugging Face Inference Providers

เส้นทางที่ 5: เครดิตทดลองบน Colab, Kaggle, RunPod และ Lambda

สร้างคอลเล็กชัน Apidog ที่ไม่ขึ้นกับผู้ให้บริการ

คุณควรเลือกเส้นทางฟรีเส้นทางไหน?

เมื่อไหร่ที่ควรย้ายออกจากบริการฟรี

คำถามที่พบบ่อย

Top comments (0)