DeepSeek V4 dirilis pada 23 April 2026 dengan jalur gratis yang benar-benar tersedia. Obrolan web resmi menjalankan V4-Pro tanpa kartu kredit, dan bobotnya berlisensi MIT bisa langsung diunduh. Agregator seperti OpenRouter serta Chutes biasanya menawarkan tingkatan gratis dalam hitungan hari setelah rilis. Dengan kombinasi ini, Anda dapat menjalankan beban kerja V4 secara gratis hingga siap beralih ke penagihan berbayar.
Panduan ini membahas jalur gratis yang bisa diverifikasi, skenario penggunaan yang cocok, serta langkah menyiapkan koleksi siap produksi di Apidog agar transisi ke penagihan lebih mudah saat penggunaan meningkat.
Untuk overview produk, lihat apa itu DeepSeek V4. Untuk panduan API lengkap, lihat cara menggunakan DeepSeek V4 API.
TL;DR
- chat.deepseek.com — Obrolan web gratis di V4-Pro. Terdapat mode Think High & Think Max, tanpa kartu kredit.
- Bobot Hugging Face + GPU sendiri — Lisensi MIT; V4-Flash berjalan di 2–4 H100, V4-Pro butuh cluster.
- Tingkatan gratis OpenRouter & Chutes — Gateway pihak ketiga, biasanya buka kuota gratis seminggu setelah peluncuran.
- Penyedia Inferensi Hugging Face — Endpoint bersama, gratis tapi dibatasi laju.
- Kredit uji coba Kaggle, Colab, RunPod — Komputasi gratis untuk eksperimen hosting mandiri.
- Semua jalur gratis membatasi penggunaan. Untuk produksi, segera beralih ke penagihan sebelum kena limit.
Jalur 1: chat.deepseek.com (jalur gratis default)
Jalur gratis paling cepat dan stabil adalah antarmuka obrolan resmi. V4-Pro sebagai default; tombol di bagian atas memungkinkan switching antara Non-Think, Think High, dan Think Max.
Pengaturan
- Buka chat.deepseek.com.
- Login dengan email, Google, atau WeChat.
- Pastikan model aktif adalah V4-Pro.
- Mulai gunakan fitur chat.
Fitur utama
- Jendela konteks 1M-token penuh.
- Upload file (PDF, gambar, bundel kode).
- Pencarian web on-demand.
- Tiga mode penalaran (termasuk Think Max).
- Riwayat percakapan & folder.
Batasan
DeepSeek tidak menetapkan batas pesan harian yang ketat; pembatasan bersifat lunak saat trafik tinggi. Penggunaan berat bisa memperlambat respons atau mengantre permintaan, tapi jarang blokir keras. Jika sering terblokir laju, kurangi frekuensi atau pindah ke API.
Cocok untuk: Benchmark prompt sulit, review kode, analisis kontrak.
Tidak cocok untuk: Otomatisasi atau workflow yang perlu reproduktif.
Jalur 2: Hosting Mandiri V4-Flash di GPU Sendiri
V4-Flash (lisensi MIT) sangat cocok untuk self-hosting. Dengan 284B total, 13B aktif, bisa jalan di multi-H100 (FP8) atau single 80GB (INT4).
Biaya utama: Perangkat keras, bukan lisensi. Jika sudah punya GPU, jalur ini paling tahan lama dan tidak dapat dibatasi laju atau ditarik.
Download Bobot
pip install -U "huggingface_hub[cli]"
huggingface-cli login
huggingface-cli download deepseek-ai/DeepSeek-V4-Flash \
--local-dir ./models/deepseek-v4-flash
Ukuran ~500GB (FP8). Pastikan ruang disk memadai.
Jalankan dengan vLLM
pip install "vllm>=0.9.0"
vllm serve deepseek-ai/DeepSeek-V4-Flash \
--tensor-parallel-size 4 \
--max-model-len 1048576 \
--dtype auto \
--port 8000
Setelah running, arahkan klien OpenAI-compatible ke http://localhost:8000/v1. Endpoint ini kompatibel dengan DeepSeek API berbayar; Apidog bisa langsung memakainya sebagai base URL baru, koleksi tetap berjalan tanpa perubahan.
Kebutuhan Hardware
| Varian | Kartu min (FP8) | Kartu min (INT4) | Throughput |
|---|---|---|---|
| V4-Flash | 2 × H100 80GB | 1 × H100 80GB | 50–150 tok/s |
| V4-Pro | 16 × H100 80GB | 8 × H100 80GB | tergantung klaster |
Jika tidak punya GPU idle, sewa GPU biasanya kalah murah dibanding API. Jalur ini cocok untuk tim dengan GPU sendiri atau kebutuhan kepatuhan khusus.
Jalur 3: Tingkatan Gratis OpenRouter
OpenRouter adalah gateway API yang agregasi banyak model open dan closed. Biasanya cepat membuka tingkatan gratis setelah DeepSeek rilis.
Pengaturan
- Daftar di openrouter.ai.
- Buat API key.
- Cek katalog model:
deepseek/deepseek-v4-proataudeepseek/deepseek-v4-flash(versi gratis biasanya berakhiran:free). - Panggil via SDK OpenAI-compatible.
from openai import OpenAI
client = OpenAI(
api_key=OPENROUTER_KEY,
base_url="https://openrouter.ai/api/v1",
)
response = client.chat.completions.create(
model="deepseek/deepseek-v4-flash:free",
messages=[{"role": "user", "content": "Write a Python CLI for semver bumping."}],
)
print(response.choices[0].message.content)
Batasan
Kuota gratis biasanya dibatasi ratusan permintaan/hari/API key dan prioritas rendah saat beban tinggi. Cocok untuk prototipe, bukan produksi.
Jalur 4: Penyedia Inferensi Hugging Face
Hugging Face menyediakan endpoint inferensi gratis setelah rilis model. Laju dan latensi dibatasi, tapi bisa langsung dipakai untuk eksperimen.
from huggingface_hub import InferenceClient
client = InferenceClient(model="deepseek-ai/DeepSeek-V4-Flash")
response = client.chat_completion(
messages=[{"role": "user", "content": "Summarize the V4 technical report in 5 bullets."}],
max_tokens=512,
)
print(response.choices[0].message.content)
Token HF gratis. Untuk penggunaan berat, upgrade ke akun Pro agar limit lebih longgar (masih lebih murah dari API resmi untuk beban sejenis).
Jalur 5: Kredit Uji Coba Colab, Kaggle, RunPod, Lambda
Penyedia GPU besar menawarkan kredit uji coba yang cukup untuk eksperimen V4-Flash skala kecil.
- Google Colab: T4 gratis terlalu kecil, tapi Colab Pro+ (500 unit/bulan) cukup untuk beberapa eksperimen di A100.
- Kaggle: GPU mingguan gratis (T4, P100). Cukup untuk V4-Flash terkuantisasi, tidak untuk V4-Pro.
- RunPod: $10 kredit uji coba, bisa beberapa jam di H100 (jalankan vLLM, benchmarking, lalu shutdown).
- Lambda: Promo jam gratis di H100/H200, cek halaman pendaftaran.
Bukan jalur gratis jangka panjang—hanya untuk eksperimen terbatas.
Build Koleksi Apidog Agnostik Penyedia
Satu koleksi di Apidog bisa menguji prompt yang sama di semua backend tanpa duplikasi script.
Alur implementasi:
- Install Apidog.
- Buat koleksi dengan 4 environment:
chat(placeholder),deepseek(https://api.deepseek.com/v1),openrouter(https://openrouter.ai/api/v1),self-hosted(http://localhost:8000/v1). - Simpan satu permintaan POST ke
{{BASE_URL}}/chat/completions. - Simpan API key tiap penyedia sebagai secret variable.
- Swap environment untuk A/B testing prompt di backend berbeda.
Pola ini juga digunakan untuk koleksi GPT-5.5 gratis; satu alat, semua penyedia, tanpa replikasi pekerjaan.
Jalur Gratis Mana yang Paling Cocok?
Empat heuristik praktis:
- Ingin coba cepat: Pakai chat.deepseek.com.
- Prototipe produk: Pakai tingkatan gratis OpenRouter, lanjut ke DeepSeek setelah limit.
- Punya GPU dan kebutuhan compliance: Hosting mandiri V4-Flash via vLLM.
- Butuh gratis jangka panjang: Tidak ada. Semua jalur gratis dibatasi; gabungkan chat.deepseek.com untuk interaktif dan API berbayar untuk otomasi.
Kapan Harus Berhenti Gratis?
Tiga indikator Anda perlu upgrade ke berbayar:
- Sering terblokir laju (>1x/hari): Beban kerja layak dialokasikan budget.
- Butuh SLA: Hanya API resmi yang menyediakan.
- Perlu pencatatan/audit/compliance: API berbayar punya billing records, tingkatan gratis agregator tidak.
Jika menemui hal di atas, segera beralih ke API resmi. Minimal top-up $2 dengan harga per-token terendah.
FAQ
Apakah chat.deepseek.com benar-benar gratis?
Ya, tanpa kartu kredit, tanpa trial. Pembatasan hanya lunak, tidak berbayar.
Perlu akun Hugging Face untuk unduh bobot?
Secara teknis tidak (repo publik). Praktisnya, login dapat limit download lebih besar.
Jalur gratis mana yang benar-benar V4-Pro?
chat.deepseek.com menjalankan V4-Pro penuh. OpenRouter biasanya hanya V4-Flash gratis. Jika butuh V4-Pro tanpa bayar, web chat paling andal.
Bisakah tingkatan gratis dipakai produk?
Tidak disarankan. Batas laju, ketentuan bisa berubah, kadang hilang. Untuk produk, gunakan API berbayar/hosting mandiri.
Hosting mandiri benar-benar gratis?
Lisensi gratis, hardware tidak. Jika sudah punya GPU, biaya hanya listrik. Sewa GPU sering kalah dengan API berbayar.
Apakah akan ada tingkatan gratis Apidog untuk testing?
Apidog gratis untuk desain & pengujian API; biaya hanya saat akses API berbayar. Jadi, workspace Apidog gratis bisa digabung dengan chat.deepseek.com atau OpenRouter untuk workflow yang sepenuhnya gratis.



Top comments (0)