DeepSeek, 2026 LLM fiyatlandırmasındaki en agresif geçici indirimlerden birini kalıcı tarifeye çevirdi. Ekip, 22 Mayıs’ta %75 indirimli DeepSeek-V4-Pro teklifinin 31 Mayıs 2026 TSİ 15:59’da bitmeyeceğini duyurdu. Yeni kalıcı fiyatlar: giriş tokenları için milyon başına 0,435 $, çıkış tokenları için 0,87 $ ve önbellek isabetleri için 0,003625 $. Bu yazıda değişen fiyatları, önbellek etkisini ve API geliştiricilerinin bu hafta uygulayabileceği geçiş adımlarını özetliyoruz.
Özet
- DeepSeek-V4-Pro API fiyatlandırması artık orijinal liste fiyatının 1/4’ü: giriş için 0,435 $/MTok, çıkış için 0,87 $/MTok, önbellek isabeti için 0,003625 $/MTok.
- 31 Mayıs 2026’da sona ermesi beklenen %75 promosyon indirimi artık normal tarife. Geri dönüş veya sürpriz bitiş tarihi yok.
- V4-Pro, çıkış tokenlarında GPT-5.5’ten yaklaşık 34 kat daha ucuzken, çoğu kodlama ve muhakeme kıyaslamasında GPT-5.5’in yaklaşık %95’i içinde yer alıyor.
- 0,003625 $/MTok önbellek isabet fiyatı kritik: uzun sistem istemleri ve araç şemaları, doğru tasarlanırsa neredeyse ücretsiz önek maliyetine yaklaşabilir.
- Geçen çeyrekte AI özelliklerinizi GPT-5.5 veya Claude Opus 4.7 maliyetlerine göre planladıysanız, bu hafta maliyet modelinizi yeniden hesaplamanız gerekir.
Bu neden önemli?
LLM fiyatları genellikle yavaş ve dipnotlarla düşer. DeepSeek bu sefer promosyonu bitirmek yerine fiyatı sabitledi. Bu, tek seferlik bir kampanyadan çok, öncü model ekonomisinin nereye gittiğine dair güçlü bir sinyal.
Eğer ürününüz kritik yolda LLM çağırıyorsa — otomatik tamamlama, RAG sohbeti, kod inceleme, ajan döngüleri — milyon çıkış tokenı başına 3,48 $ ile 0,87 $ arasındaki fark doğrudan faturanıza yansır.
Örnek:
- Günlük çıkış tokenı: 50 milyon
- Eski çıkış fiyatı: 3,48 $/MTok
- Yeni çıkış fiyatı: 0,87 $/MTok
Aylık çıkış maliyeti yaklaşık olarak:
Eski: 50 × 3,48 × 30 = 5.220 $
Yeni: 50 × 0,87 × 30 = 1.305 $
Tasarruf: 3.915 $ / ay
DeepSeek üzerine geliştiriyorsanız, Apidog ile V4-Pro API çağrılarını tek çalışma alanında oluşturabilir, test edebilir ve izleyebilirsiniz. Akış, araç çağrıları ve JSON şema doğrulama akışlarını aynı koleksiyon içinde tutabilirsiniz.
Aşağıda yeni fiyat listesini, GPT-5.5 ve Claude Opus 4.7 ile karşılaştırmayı, önbellek isabeti matematiğini, örnek fatura senaryolarını ve geçiş için uygulanabilir bir karar çerçevesini bulacaksınız.
Ne değişti?
DeepSeek’in resmi fiyatlandırma bildirimi kısa, ancak geliştiriciler için üç pratik sonuç çıkarıyor:
%75 indirim kalıcı hale geldi.
31 Mayıs 2026 TSİ 15:59’a kadar süren promosyonun 1 Haziran’da eski liste fiyatına dönmesi bekleniyordu. Dönmeyecek.İndirim V4-Pro için geçerli.
DeepSeek-V4-Flash zaten 0,14 $ / 0,28 $ seviyesindeydi. Asıl düşüş, öncü seviye model olan V4-Pro’da. Flash ve Pro ayrımı için DeepSeek V4 Nedir makalesine bakabilirsiniz.Önbellek isabeti fiyatı ayrıca düştü.
26 Nisan 2026 TSİ 12:15’ten itibaren önbellek isabeti fiyatı lansman fiyatının 1/10’una indirildi. Bu, %75 ana indirimden ayrı ve onunla birlikte etkili olan bir değişiklik.
Bu tablo geliştiriciler için şu anlama geliyor: DeepSeek, V4-Pro üzerinde ajanlar, uzun bağlamlı iş akışları ve araç kullanan sistemler geliştirmenizi istiyor. Özellikle sabit sistem istemleri ve araç şemaları kullanan uygulamalarda önbellek tasarımı artık doğrudan maliyet optimizasyonu demek.
Yeni kalıcı fiyat listesi
Milyon token başına fiyatlandırma, USD:
| Token türü | Eski liste | Yeni kalıcı | İndirim |
|---|---|---|---|
| Giriş, önbellek ıskası | $1.74 | $0.435 | 75% |
| Giriş, önbellek isabeti | $0.0145 | $0.003625 | 75% |
| Çıkış | $3.48 | $0.87 | 75% |
Bu tabloyu uygulama açısından şöyle okumak gerekir:
- Çıkış tokenları en büyük fatura kalemidir. Kod üreten, plan yapan veya uzun yanıt veren ajanlarda maliyetin çoğu çıkıştan gelir.
- Önbellek isabeti oranı kritik hale geldi. Giriş ıskası ile giriş isabeti arasında yaklaşık 120:1 fark var.
- Bu fiyatlar API için geçerli. DeepSeek’in web sohbeti bireyler için ücretsiz kalmaktadır.
V4 fiyatlandırma katmanları ve Flash-Pro dengesi için DeepSeek V4 API Fiyatlandırması referansına bakabilirsiniz.
V4-Pro, GPT-5.5, Claude Opus 4.7 ve Gemini 3.5 Flash ile nasıl karşılaştırılıyor?
Asıl soru V4-Pro’nun eski fiyatına göre ucuzlaması değil. Soru şu: Aynı iş yükünü diğer öncü modeller yerine V4-Pro ile çalıştırabilir misiniz?
| Model | Giriş ($/MTok) | Çıkış ($/MTok) | SWE-bench Pro |
|---|---|---|---|
| DeepSeek-V4-Pro, yeni | $0.435 | $0.87 | 55.4% |
| GPT-5.5 | $5.00 | $30.00 | 58.6% |
| Claude Opus 4.7 | $3.00 | $15.00 | ~62% |
| Gemini 3.5 Flash | ~$1.50 | ~$9.00 | ~48% |
| DeepSeek-V4-Flash | $0.14 | $0.28 | ~42% |
Çıkış tokenlarında DeepSeek-V4-Pro, GPT-5.5’ten 34 kat ve Claude Opus 4.7’den 17 kat daha ucuzdur. DataCamp karşılaştırmasına göre V4-Pro, çoğu herkese açık kodlama ve muhakeme değerlendirmesinde GPT-5.5’in 3 ila 7 yüzde puanı içinde yer alıyor.
Pratik karar:
- Kalite farkı kabul edilebilirse, geçiş doğrudan maliyet avantajı sağlar.
- Son kalite puanları kritikse, V4-Pro’yu tüm trafik için değil, yönlendirilmiş trafik için kullanın.
- Premium modeli yalnızca zor sınıflandırılan isteklerde, uzun ufuklu planlamada veya yüksek riskli araç çağrılarında tutun.
Daha ayrıntılı karşılaştırmalar için Kodlama için DeepSeek V4 vs Claude Opus 4.5 ve GLM-5 vs DeepSeek V3 vs GPT-5: hız, maliyet ve pratik geliştirici karşılaştırması yazılarına bakabilirsiniz.
Önbellek isabeti neden bu kadar önemli?
Çoğu kişi 0,87 $ çıkış fiyatına odaklanıyor. Ancak 0,003625 $/MTok önbellek isabetli giriş fiyatı, sistem tasarımını değiştiriyor.
DeepSeek istem önbelleği, isteğinizin öneki yaklaşık 30 dakikalık pencere içinde önceki bir istekle bayt düzeyinde aynı olduğunda isabet eder. Sohbet ajanlarında bu önek genellikle şunlardan oluşur:
- Sistem istemi
- Araç tanımları
- JSON şemaları
- Kurallar
- Few-shot örnekleri
- Sabit talimat blokları
Bu bloklar çoğu ajan sisteminde 4.000 ila 10.000 token arasında olabilir.
Örnek maliyet hesabı
Varsayım:
- Sistem istemi: 6.000 token
- Günlük sohbet turu: 100.000
- Ortalama kullanıcı mesajı: 200 giriş tokenı
- Ortalama yanıt: 800 çıkış tokenı
Önbellek olmadan giriş maliyeti:
100.000 × 6.200 × 0,435 / 1.000.000 = 269,70 $ / gün
Sistem istemi tokenlarının %90’ı önbelleğe isabet ederse:
100.000 × [
200 × 0,435
+ 6.000 × (0,9 × 0,003625 + 0,1 × 0,435)
] / 1.000.000
≈ 32 $ / gün
Bu, giriş maliyetinde yaklaşık %88 azalma demektir.
İstem önbelleklemenin çalışma mantığı için istem önbellekleme derinlemesine analizimize bakabilirsiniz.
Gerçek ajanlarda önbellek isabeti almak için 3 desen
1. Öneki sabitleyin
Sistem istemini, araç şemalarını ve few-shot örneklerini her isteğin başında aynı sırayla gönderin.
Kötü desen:
system:
Kullanıcı: {{user_id}}
Zaman: {{timestamp}}
Kurallar...
Araçlar...
Daha iyi desen:
system:
Kurallar...
Araçlar...
Few-shot örnekleri...
user:
Kullanıcı: {{user_id}}
Zaman: {{timestamp}}
Mesaj: {{message}}
İstek başına değişen değerleri sistem istemine koymayın.
2. Dinamik bağlamı kararlı sıralayın
RAG kullanıyorsanız, getirilen doküman parçalarını rastgele sırayla eklemeyin. Aynı sorgu sınıfı için mümkün olduğunca kararlı sıralama kullanın.
Örnek yaklaşım:
1. Kaynakları skorla
2. Skora göre sırala
3. Aynı skor varsa doküman ID’ye göre sırala
4. Bağlamı aynı formatla ekle
Küçük format değişiklikleri bile önbellek isabetini düşürebilir.
3. Isınma çağrısı çalıştırın
Ajan başlatılırken tam sabit önekle düşük riskli bir istek gönderin. Amaç, sağlayıcı önbelleğini kullanıcı trafiği başlamadan önce doldurmaktır.
Örnek:
curl https://api.deepseek.com/chat/completions \
-H "Authorization: Bearer $DEEPSEEK_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek-v4-pro",
"messages": [
{
"role": "system",
"content": "Sabit sistem istemi, araç tanımları ve kurallar..."
},
{
"role": "user",
"content": "Hazır mısın?"
}
]
}'
Bu hafta ne yapmalısınız?
Geçiş kararı “tamamı ya da hiçbiri” olmak zorunda değil. Aşağıdaki beş adım, hangi trafiği V4-Pro’ya taşıyabileceğinizi belirlemenize yardımcı olur.
1. Çıkış:giriş oranınızı ölçün
Önce mevcut LLM kullanımınızı token türüne göre ayırın.
Örnek metrikler:
input_tokens_total
output_tokens_total
cache_hit_tokens_total
cache_miss_tokens_total
cost_by_route
cost_by_model
Eğer token bütçenizin çoğu çıkışa gidiyorsa — ajanlar, kod üretimi, içerik üretimi — V4-Pro tasarrufu büyük olur.
Eğer bütçenin çoğu girişe gidiyorsa — uzun doküman RAG, özetleme, arama destekli sohbet — önbellek isabeti oranını ayrıca optimize edin.
2. Üretim trafiğinizden 100 örnek seçin
Genel kıyaslamalara tek başına güvenmeyin. Kendi ürününüzden örnek alın.
Minimum değerlendirme seti:
- 30 kolay istek
- 30 orta zorlukta istek
- 20 araç çağrısı içeren istek
- 10 uzun bağlamlı istek
- 10 başarısızlık riski yüksek istek
Her örneği mevcut modeliniz ve V4-Pro ile aynı istem üzerinden çalıştırın. Sonuçları kendi değerlendiricinizle puanlayın.
3. Trafiği rota bazında bölün
V4-Pro’yu tüm sisteme bir anda geçirmek yerine rota bazında uygulayın.
Örnek yönlendirme:
Basit sohbet -> V4-Pro
Kod açıklama -> V4-Pro
Kod üretimi -> V4-Pro + kalite kontrol
Uzun planlama -> premium model
Yüksek riskli araç çağrısı -> premium model veya çift doğrulama
Çoğu ekip için trafiğin %70 ila %85’ini daha ucuz modele almak, kalite gerilemesini sınırlarken maliyetin büyük kısmını düşürür.
4. Sistem istemlerini önbellek için yeniden düzenleyin
Denetlenecek noktalar:
- Sistem isteminde timestamp var mı?
- Kullanıcı ID sistem mesajına yazılıyor mu?
- Oturum ID sabit öneke giriyor mu?
- Araç şemalarının sırası değişiyor mu?
- RAG parçalarının sıralaması kararsız mı?
- Few-shot örnekleri her istekte farklı mı?
Bu alanları sabitleyin veya dinamik bölümü kullanıcı mesajına taşıyın.
5. Regresyon testi kurun
Model değiştirmeden önce altın yanıt seti oluşturun. Aynı istekleri hem mevcut modelinize hem V4-Pro’ya gönderin ve farkları inceleyin.
Apidog burada pratik bir test akışı sağlar:
- Mevcut OpenAI uyumlu koleksiyonunuzu içe aktarın.
- Base URL değerini
https://api.deepseek.comolarak değiştirin. - V4-Pro model adını ekleyin.
- Aynı istekleri yeniden oynatın.
- JSON şema doğrulamasıyla araç çağrısı formatlarını kontrol edin.
- Yanıt farklarını regresyon seti olarak kaydedin.
Apidog’u indirin, koleksiyonunuzu içe aktarın ve birkaç dakika içinde yan yana duman testi çalıştırın.
V4-Pro uç nokta yapısı için DeepSeek V4 API Nasıl Kullanılır yazısına bakabilirsiniz.
V4-Pro, diğer 2026 fiyat düşüşlerine karşı nerede duruyor?
DeepSeek fiyat düşüren tek sağlayıcı değil. 2026 LLM pazarı genel olarak marj sıkışması yaşıyor:
- OpenAI O3 bu yılın başlarında %80 düştü. Hesaplama için O3 fiyatlandırma dökümüne bakabilirsiniz.
- Kimi K2, DeepSeek’in V3 katmanıyla rekabet etmek için agresif fiyatlandı. Kimi K2 API fiyatlandırması detayları kapsar.
- Anthropic Claude, Opus fiyatlandırmasını korurken daha ucuz Haiku ve Sonnet katmanlarını öne çıkardı. Claude API maliyet dökümü, katmanların konumunu açıklar.
V4-Pro indiriminin farkı, bütçe modelini değil, öncü yetenek bandını hedeflemesi. Bu yüzden maliyet hesabını daha güçlü biçimde değiştiriyor.
Maliyet hesabı değişti
DeepSeek yalnızca fiyat düşürmedi; öncü model maliyeti için yeni bir referans noktası oluşturdu. Dolar altı çıkış fiyatlandırması artık istisna değil, geliştiricilerin dikkate alması gereken pratik bir seçenek.
Bu hafta uygulanabilir üç adım:
- En maliyetli üç LLM iş yükünüzü çıkarın.
- Sabit öneklerinizi ve önbellek isabet oranınızı denetleyin.
- Apidog ile regresyon testi kurup V4-Pro’yu mevcut modelinizle yan yana çalıştırın.
Promosyon bayrağı kalktı. İndirim kalkmadı.
Top comments (0)