DeepSeek, modellerin piyasaya sürüldüğü gün olan 23 Nisan 2026'da V4 fiyatlandırmasını duyurdu ve bu fiyatlar, ileri seviye yapay zeka için maliyet tabanını yeniden tanımladı. V4-Flash modeli, milyon giriş token başına 0,14 ABD doları ve milyon çıkış token başına 0,28 ABD doları ücretlendirilirken; V4-Pro modeli ise milyon giriş için 1,74 ABD doları ve çıkış için 3,48 ABD doları olarak ücretlendirilir. Her iki model de 1M token bağlam penceresi ve 384K'ya kadar çıkış tokenı sunar. Ayrıca, tekrarlanan istemlerde giriş maliyetini %80-%90 oranında azaltan otomatik önbellek isabet indirimi bulunur.
Bu rehberde; tam fiyat tablosunu, bağlam önbelleklemenin gerçek çağrı başına maliyeti nasıl düşürdüğünü, GPT-5.5 ve Claude Opus ile doğrudan kıyaslamayı ve Apidog ile harcamayı öngörülebilir tutmanın dört yolunu bulacaksınız.
Ürüne genel bakış için, DeepSeek V4 nedir yazısına göz atın. Geliştirici kılavuzu için, DeepSeek V4 API nasıl kullanılır makalesini inceleyin. Sıfır maliyetli yollar için, DeepSeek V4 ücretsiz nasıl kullanılır başlıklı yazıyı okuyun.
ÖZET
- V4-Flash: $0,14 / M giriş (önbellek ıskası), $0,028 / M giriş (önbellek isabeti), $0,28 / M çıkış.
- V4-Pro: $1,74 / M giriş (önbellek ıskası), $0,145 / M giriş (önbellek isabeti), $3,48 / M çıkış.
- Bağlam penceresi: Her iki varyantta da 1M token giriş, 384K token çıkış.
- Önbellek isabeti indirimi: Flash için yaklaşık %80, Pro için yaklaşık %92 indirim.
-
deepseek-chatvedeepseek-reasonermodelleri 24 Temmuz 2026'da kullanımdan kaldırılacak; faturalandırma V4-Flash üzerinden yapılacak. - V4-Pro, girişte GPT-5.5'ten yaklaşık 2,9 kat, çıkışta ise 8,6 kat daha ucuz.
Tam fiyat listesi
| Model | Giriş (önbellek ıskası) | Giriş (önbellek isabeti) | Çıkış | Bağlam |
|---|---|---|---|---|
deepseek-v4-flash |
$0.14 / M | $0.028 / M | $0.28 / M | 1M / 384K |
deepseek-v4-pro |
$1.74 / M | $0.145 / M | $3.48 / M | 1M / 384K |
deepseek-chat (Kaldırılıyor) |
V4-Flash Düşünme Dışı | — | — | — |
deepseek-reasoner (Kaldırılıyor) |
V4-Flash Düşünme | — | — | — |
Önemli detaylar:
- Düşünme ve düşünme dışı modda fiyatlar aynıdır; model kimliği oranı belirler.
- Önbellek isabet fiyatlandırması otomatik ve kullanıcı müdahalesi gerektirmez. Önekler en az 1.024 token olmalı ve tam eşleşmeli.
- Eski
deepseek-chatvedeepseek-reasonerkimlikleri artık V4-Flash olarak faturalandırılır, 24 Temmuz 2026 sonrası tamamen kaldırılacak.
Basit Bağlam Önbellekleme
Önbellekleme, DeepSeek V4'te önemli bir maliyet avantajı sağlar. Özellikle tekrarlayan uzun sistem istemleri, ajan araç şemaları ve RAG bağlamı ile çalışıyorsanız, tekrar eden önekler sayesinde sonraki çağrılarda giriş token maliyeti ciddi oranda düşer.
Pratik Örnek:
- 20.000 tokenlık sabit sistem istemi olan bir ajanınız var, ardından her biri 200 token olan 100 kullanıcı sorusu soruyorsunuz.
Önbellekleme Olmadan:
Giriş: 100 çağrı × 20.200 token × $1,74 / M = $3,52
Çıkış: 100 çağrı × 500 token × $3,48 / M = $0,17
Toplam: $3,69
Önbellekleme ile (ilk çağrı ıskası, sonraki 99 isabet):
İlk çağrı girişi: 20.200 × $1,74 / M = $0,035
99 önbellek isabetli önek: 99 × 20.000 × $0,145 / M = $0,287
99 kullanıcı dönüşü (ıskası): 99 × 200 × $1,74 / M = $0,034
Çıkış: 100 × 500 × $3,48 / M = $0,174
Toplam: $0,53
Yani, aynı iş yükünde yaklaşık 7 kat daha ucuz. V4-Flash'ta bu etki daha da büyüktür.
GPT-5.5 ve Claude ile Karşılaştırma
Aşağıdaki tablo, giriş/çıkış başına maliyetleri ve bağlam limitlerini pratik olarak karşılaştırır:
| Model | Giriş (standart) | Giriş (önbellekli) | Çıkış | Bağlam |
|---|---|---|---|---|
| DeepSeek V4-Flash | $0.14 / M | $0.028 / M | $0.28 / M | 1M |
| DeepSeek V4-Pro | $1.74 / M | $0.145 / M | $3.48 / M | 1M |
| GPT-5.5 | $5 / M | $1.25 / M | $30 / M | 1M |
| GPT-5.5 Pro | $30 / M | — | $180 / M | 1M |
| Claude Opus 4.6 | $15 / M | $1.50 / M | $75 / M | 200K |
Yorumlar:
- V4-Pro, çıkış tokenında GPT-5.5'ten 8,6 kat, Claude Opus 4.6'dan 21 kat daha ucuzdur.
- Önbellekli girişte, V4-Pro hem GPT-5.5 hem de Claude karşısında yaklaşık 10 kat daha ucuzdur.
- Performans olarak V4-Pro, LiveCodeBench ve Codeforces'ta GPT-5.5 seviyesinde veya üzerinde; maliyeti ise çok daha düşük. Detaylı kıyas için DeepSeek V4 nedir yazısına bakın.
Not: Bazı senaryolarda Claude veya Gemini modelleri uzun bağlamda veya belirli testlerde daha iyi olabilir, fakat maliyet/performans oranı çoğu iş yükünde DeepSeek lehine.
Yaygın İş Yükleri için Maliyet Modellemesi
Aşağıda üretimde sık karşılaşılan 4 iş yükü ve V4-Pro için maliyetleri yer alıyor (önbellek ıskası tabanlı):
1. Ajanlı Kodlama Döngüsü (50K bağlam, 2K çıkış, görev başına 20 çağrı)
Giriş: 50.000 × 20 × $1,74 / M = $1,74
Çıkış: 2.000 × 20 × $3,48 / M = $0,14
Görev başına toplam: ~$1,88
GPT-5.5 ile aynı iş yükü ~$6,20
2. Uzun Belge Soru-Cevap (500K bağlam, 1K çıkış)
Giriş: 500.000 × $1,74 / M = $0,87
Çıkış: 1.000 × $3,48 / M = $0,003
Çağrı başına toplam: ~$0,87
GPT-5.5 ile aynı iş yükü ~$2,53
3. Yüksek Hacimli Sınıflandırma (2K bağlam, 200 çıkış, 10.000 çağrı)
Bu senaryoda V4-Flash daha uygun.
Giriş: 2.000 × 10.000 × $0,14 / M = $2,80
Çıkış: 200 × 10.000 × $0,28 / M = $0,56
Toplam: ~$3,36
GPT-5.5 ile aynı iş yükü ~$110
4. Tekrarlanan İstemli Sohbet Robotu (10K sistem istemi, 500 kullanıcı tokenı, 1K çıkış, 1.000 oturum)
İlk çağrı girişi: 10.500 × $1,74 / M = $0,018
Önbellek isabetli giriş: 999 × 10.000 × $0,145 / M = $1,45
Kullanıcı dönüşleri: 999 × 500 × $1,74 / M = $0,87
Çıkış: 1.000 × 1.000 × $3,48 / M = $3,48
Toplam: ~$5,82
GPT-5.5 ile aynı iş yükünde ~$26,35
Dikkat Edilmesi Gereken Gizli Maliyetler
Fiyat tablosu tek başına yeterli değildir; aşağıdaki noktalar ilk aylarda faturada sürpriz yaratabilir:
-
Düşünme modu token enflasyonu:
thinking_max, aynı istemdenon-thinkinge göre 3-10 kat fazla çıkış tokenı üretir. Token kullanımı ciddi artar.thinking_maxmodunu isteğe bağlı olarak kullanın ve izleyin. - Sessiz bağlam büyümesi: Ajan döngülerinde tüm konuşmayı tekrar tekrar bağlama eklemeyin. Çok hızlı büyür. Kısaltma ve özetlemeyle sınırlandırın.
- Yeniden deneme fırtınaları: Yanlış yapılandırılmış döngülerde, tekrar tekrar başarısız istekler faturayı hızla artırır. Üstel geri çekilme ve istek başına sabit retry limiti ekleyin.
- Geliştirme döngüsü: curl ile elle deneme yapmak her seferinde tüm bağlamı yeniden çalıştırır. Apidog ile değişken ikamesi ve ücretsiz denemelerle bu maliyetleri minimize edin.
Apidog'da Maliyeti Takip Etme
Maliyetleri sürekli kontrol etmek için pratik bir iş akışı:
-
Apidog'u indirin ve
DEEPSEEK_API_KEY'i ortam değişkeni olarak tanımlayın. -
https://api.deepseek.com/v1/chat/completionsadresine tek bir POST isteği kaydedin. - Yanıt panelinde
usage.prompt_tokens,usage.completion_tokensveusage.reasoning_tokensdeğerlerini sabitleyin. Her çağrıda, çıktıyla birlikte maliyet analizi anında görünür. -
modelvethinking_modeparametrelerini değiştirerek V4-Flash/V4-Pro ve Düşünme-Dışı/Düşünme-Max A/B testi yapın. - GPT-5.5 için aynı koleksiyonu oluşturun (detaylar için GPT-5.5 API rehberi). Böylece iki sağlayıcıda da maliyetleri tek pencerede karşılaştırabilirsiniz.
Bu süreç, ay sonunda ortaya çıkabilecek maliyet sürprizlerinin %80'ini önden görmenizi sağlar.
Harcamayı Öngörülebilir Tutan Dört Kural
- Varsayılan olarak V4-Flash kullanın. Yalnızca kalite farkı gelir etkisi yaratıyorsa V4-Pro'ya geçin.
- Varsayılan olarak Düşünme-Dışı modunu seçin. Zor görevlerde Düşünme-Yüksek; kritik işlerde Düşünme-Maks modunu kullanın.
-
max_tokensdeğerini sınırlayın. 384K sınırı bir güvenlik önlemidir, çoğu üretim çıktısı 2K'yı geçmez. -
Kullanım telemetrisi gönderin. Her çağrıda
prompt_tokens,completion_tokens,reasoning_tokensdeğerlerini kaydedin ve özellikle reasoning token artışlarında otomatik uyarı verin.
Sıkça Sorulan Sorular
Ücretsiz bir katman var mı?
API'da ücretsiz katman yok; bazı yeni hesaplara sınırlı deneme kredisi gelebilir. API dışındaki ücretsiz yollar için DeepSeek V4'ü ücretsiz nasıl kullanacağınızı inceleyin.
Önbellek isabeti fiyatlandırması nasıl işler?
Aynı hesapta tekrarlanan 1.024+ token önekler otomatik olarak önbellekli fiyatla faturalandırılır. İlk çağrı tam oranı, takip edenler indirimli oranı öder.
Düşünme modları daha mı pahalı?
Token başına oran sabit; ancak düşünme modlarında daha fazla token kullanılır. Gerçek maliyeti ölçmek için usage.reasoning_tokens'ı izleyin.
Fiyatlar sabit mi?
DeepSeek fiyatları zaman zaman günceller. Güncel oranlar için canlı fiyatlandırma sayfasına bakın.
V4-Pro ve V4-Flash aynı çıkış oranına mı sahip?
Hayır; V4-Pro çıkışı $3,48 / M, V4-Flash çıkışı $0,28 / M. Bu yüzden çoğu iş için V4-Flash tercih edilir.
Anthropic formatındaki uç nokta fiyatı değiştiriyor mu?
Hayır; https://api.deepseek.com/anthropic OpenAI formatındaki uç nokta ile aynı fiyatı kullanır.
Uygulamada yukarıdaki adımları izleyerek maliyetleri önceden tahmin edebilir, beklenmedik faturaların önüne geçebilirsiniz. Geliştirici iş akışınızda Apidog ile entegrasyon ve otomatik telemetriyi ihmal etmeyin.
Top comments (0)