DEV Community

Cover image for Cara Menggunakan DeepSeek V4 Gratis
Walse
Walse

Posted on • Originally published at apidog.com

Cara Menggunakan DeepSeek V4 Gratis

DeepSeek V4 dirilis pada 23 April 2026 dengan jalur gratis yang benar-benar tersedia. Obrolan web resmi menjalankan V4-Pro tanpa kartu kredit, dan bobotnya berlisensi MIT bisa langsung diunduh. Agregator seperti OpenRouter serta Chutes biasanya menawarkan tingkatan gratis dalam hitungan hari setelah rilis. Dengan kombinasi ini, Anda dapat menjalankan beban kerja V4 secara gratis hingga siap beralih ke penagihan berbayar.

Coba Apidog hari ini

Panduan ini membahas jalur gratis yang bisa diverifikasi, skenario penggunaan yang cocok, serta langkah menyiapkan koleksi siap produksi di Apidog agar transisi ke penagihan lebih mudah saat penggunaan meningkat.

Untuk overview produk, lihat apa itu DeepSeek V4. Untuk panduan API lengkap, lihat cara menggunakan DeepSeek V4 API.

TL;DR

  • chat.deepseek.com — Obrolan web gratis di V4-Pro. Terdapat mode Think High & Think Max, tanpa kartu kredit.
  • Bobot Hugging Face + GPU sendiri — Lisensi MIT; V4-Flash berjalan di 2–4 H100, V4-Pro butuh cluster.
  • Tingkatan gratis OpenRouter & Chutes — Gateway pihak ketiga, biasanya buka kuota gratis seminggu setelah peluncuran.
  • Penyedia Inferensi Hugging Face — Endpoint bersama, gratis tapi dibatasi laju.
  • Kredit uji coba Kaggle, Colab, RunPod — Komputasi gratis untuk eksperimen hosting mandiri.
  • Semua jalur gratis membatasi penggunaan. Untuk produksi, segera beralih ke penagihan sebelum kena limit.

DeepSeek V4 Overview

Jalur 1: chat.deepseek.com (jalur gratis default)

Jalur gratis paling cepat dan stabil adalah antarmuka obrolan resmi. V4-Pro sebagai default; tombol di bagian atas memungkinkan switching antara Non-Think, Think High, dan Think Max.

chat.deepseek.com UI

Pengaturan

  1. Buka chat.deepseek.com.
  2. Login dengan email, Google, atau WeChat.
  3. Pastikan model aktif adalah V4-Pro.
  4. Mulai gunakan fitur chat.

Fitur utama

  • Jendela konteks 1M-token penuh.
  • Upload file (PDF, gambar, bundel kode).
  • Pencarian web on-demand.
  • Tiga mode penalaran (termasuk Think Max).
  • Riwayat percakapan & folder.

Batasan

DeepSeek tidak menetapkan batas pesan harian yang ketat; pembatasan bersifat lunak saat trafik tinggi. Penggunaan berat bisa memperlambat respons atau mengantre permintaan, tapi jarang blokir keras. Jika sering terblokir laju, kurangi frekuensi atau pindah ke API.

Cocok untuk: Benchmark prompt sulit, review kode, analisis kontrak.

Tidak cocok untuk: Otomatisasi atau workflow yang perlu reproduktif.

Jalur 2: Hosting Mandiri V4-Flash di GPU Sendiri

V4-Flash (lisensi MIT) sangat cocok untuk self-hosting. Dengan 284B total, 13B aktif, bisa jalan di multi-H100 (FP8) atau single 80GB (INT4).

Biaya utama: Perangkat keras, bukan lisensi. Jika sudah punya GPU, jalur ini paling tahan lama dan tidak dapat dibatasi laju atau ditarik.

Download Bobot

pip install -U "huggingface_hub[cli]"
huggingface-cli login
huggingface-cli download deepseek-ai/DeepSeek-V4-Flash \
  --local-dir ./models/deepseek-v4-flash
Enter fullscreen mode Exit fullscreen mode

Ukuran ~500GB (FP8). Pastikan ruang disk memadai.

Jalankan dengan vLLM

pip install "vllm>=0.9.0"

vllm serve deepseek-ai/DeepSeek-V4-Flash \
  --tensor-parallel-size 4 \
  --max-model-len 1048576 \
  --dtype auto \
  --port 8000
Enter fullscreen mode Exit fullscreen mode

Setelah running, arahkan klien OpenAI-compatible ke http://localhost:8000/v1. Endpoint ini kompatibel dengan DeepSeek API berbayar; Apidog bisa langsung memakainya sebagai base URL baru, koleksi tetap berjalan tanpa perubahan.

Kebutuhan Hardware

Varian Kartu min (FP8) Kartu min (INT4) Throughput
V4-Flash 2 × H100 80GB 1 × H100 80GB 50–150 tok/s
V4-Pro 16 × H100 80GB 8 × H100 80GB tergantung klaster

Jika tidak punya GPU idle, sewa GPU biasanya kalah murah dibanding API. Jalur ini cocok untuk tim dengan GPU sendiri atau kebutuhan kepatuhan khusus.

Jalur 3: Tingkatan Gratis OpenRouter

OpenRouter adalah gateway API yang agregasi banyak model open dan closed. Biasanya cepat membuka tingkatan gratis setelah DeepSeek rilis.

OpenRouter

Pengaturan

  1. Daftar di openrouter.ai.
  2. Buat API key.
  3. Cek katalog model: deepseek/deepseek-v4-pro atau deepseek/deepseek-v4-flash (versi gratis biasanya berakhiran :free).
  4. Panggil via SDK OpenAI-compatible.
from openai import OpenAI

client = OpenAI(
    api_key=OPENROUTER_KEY,
    base_url="https://openrouter.ai/api/v1",
)

response = client.chat.completions.create(
    model="deepseek/deepseek-v4-flash:free",
    messages=[{"role": "user", "content": "Write a Python CLI for semver bumping."}],
)

print(response.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

Batasan

Kuota gratis biasanya dibatasi ratusan permintaan/hari/API key dan prioritas rendah saat beban tinggi. Cocok untuk prototipe, bukan produksi.

Jalur 4: Penyedia Inferensi Hugging Face

Hugging Face menyediakan endpoint inferensi gratis setelah rilis model. Laju dan latensi dibatasi, tapi bisa langsung dipakai untuk eksperimen.

from huggingface_hub import InferenceClient

client = InferenceClient(model="deepseek-ai/DeepSeek-V4-Flash")

response = client.chat_completion(
    messages=[{"role": "user", "content": "Summarize the V4 technical report in 5 bullets."}],
    max_tokens=512,
)

print(response.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

Token HF gratis. Untuk penggunaan berat, upgrade ke akun Pro agar limit lebih longgar (masih lebih murah dari API resmi untuk beban sejenis).

Jalur 5: Kredit Uji Coba Colab, Kaggle, RunPod, Lambda

Penyedia GPU besar menawarkan kredit uji coba yang cukup untuk eksperimen V4-Flash skala kecil.

  • Google Colab: T4 gratis terlalu kecil, tapi Colab Pro+ (500 unit/bulan) cukup untuk beberapa eksperimen di A100.
  • Kaggle: GPU mingguan gratis (T4, P100). Cukup untuk V4-Flash terkuantisasi, tidak untuk V4-Pro.
  • RunPod: $10 kredit uji coba, bisa beberapa jam di H100 (jalankan vLLM, benchmarking, lalu shutdown).
  • Lambda: Promo jam gratis di H100/H200, cek halaman pendaftaran.

Bukan jalur gratis jangka panjang—hanya untuk eksperimen terbatas.

Build Koleksi Apidog Agnostik Penyedia

Satu koleksi di Apidog bisa menguji prompt yang sama di semua backend tanpa duplikasi script.

Alur implementasi:

  1. Install Apidog.
  2. Buat koleksi dengan 4 environment: chat (placeholder), deepseek (https://api.deepseek.com/v1), openrouter (https://openrouter.ai/api/v1), self-hosted (http://localhost:8000/v1).
  3. Simpan satu permintaan POST ke {{BASE_URL}}/chat/completions.
  4. Simpan API key tiap penyedia sebagai secret variable.
  5. Swap environment untuk A/B testing prompt di backend berbeda.

Pola ini juga digunakan untuk koleksi GPT-5.5 gratis; satu alat, semua penyedia, tanpa replikasi pekerjaan.

Jalur Gratis Mana yang Paling Cocok?

Empat heuristik praktis:

  • Ingin coba cepat: Pakai chat.deepseek.com.
  • Prototipe produk: Pakai tingkatan gratis OpenRouter, lanjut ke DeepSeek setelah limit.
  • Punya GPU dan kebutuhan compliance: Hosting mandiri V4-Flash via vLLM.
  • Butuh gratis jangka panjang: Tidak ada. Semua jalur gratis dibatasi; gabungkan chat.deepseek.com untuk interaktif dan API berbayar untuk otomasi.

Kapan Harus Berhenti Gratis?

Tiga indikator Anda perlu upgrade ke berbayar:

  1. Sering terblokir laju (>1x/hari): Beban kerja layak dialokasikan budget.
  2. Butuh SLA: Hanya API resmi yang menyediakan.
  3. Perlu pencatatan/audit/compliance: API berbayar punya billing records, tingkatan gratis agregator tidak.

Jika menemui hal di atas, segera beralih ke API resmi. Minimal top-up $2 dengan harga per-token terendah.

FAQ

Apakah chat.deepseek.com benar-benar gratis?

Ya, tanpa kartu kredit, tanpa trial. Pembatasan hanya lunak, tidak berbayar.

Perlu akun Hugging Face untuk unduh bobot?

Secara teknis tidak (repo publik). Praktisnya, login dapat limit download lebih besar.

Jalur gratis mana yang benar-benar V4-Pro?

chat.deepseek.com menjalankan V4-Pro penuh. OpenRouter biasanya hanya V4-Flash gratis. Jika butuh V4-Pro tanpa bayar, web chat paling andal.

Bisakah tingkatan gratis dipakai produk?

Tidak disarankan. Batas laju, ketentuan bisa berubah, kadang hilang. Untuk produk, gunakan API berbayar/hosting mandiri.

Hosting mandiri benar-benar gratis?

Lisensi gratis, hardware tidak. Jika sudah punya GPU, biaya hanya listrik. Sewa GPU sering kalah dengan API berbayar.

Apakah akan ada tingkatan gratis Apidog untuk testing?

Apidog gratis untuk desain & pengujian API; biaya hanya saat akses API berbayar. Jadi, workspace Apidog gratis bisa digabung dengan chat.deepseek.com atau OpenRouter untuk workflow yang sepenuhnya gratis.

Top comments (0)