Xiaomi MiMo V2.5 API fiyatlandırması 27 Mayıs 2026 itibarıyla kalıcı olarak milyon giriş jetonu başına 1$, milyon çıkış jetonu başına 3$ seviyesine indi. Eski uzun bağlam çarpanı kaldırıldı: 32K, 256K veya 1M bağlam kullanmanız fiyat formülünü değiştirmiyor. Üretim tarafındaki pratik sonuç net: MiMo V2.5, 1M bağlam penceresi isteyen ekipler için en düşük maliyetli seçeneklerden biri haline geldi.
Özet
- Yeni kalıcı fiyat: MiMo V2.5 Pro için 1,00$/M giriş, 3,00$/M çıkış, 0,20$/M önbelleğe alınmış giriş.
- Bağlam çarpanı kaldırıldı: 256K+ girişlerde uygulanan yüksek uzun bağlam katmanı artık yok.
- 1M bağlam penceresi korunuyor: Uzun belge RAG, kod tabanı analizi ve depo geneli ajanlar için maliyet tahmini artık daha basit.
- Jeton Planı kullanıcıları etkilendi: Kota 5 ila 8 kat artırıldı, geçerlilik süresi içindeki kullanılan krediler sıfırlandı.
- İndirim kalıcı: Xiaomi duyurusunda bunu promosyon değil, kalıcı fiyatlandırma yenilemesi olarak konumlandırıyor.
27 Mayıs 2026'da Ne Değişti?
Xiaomi'nin resmi fiyat güncelleme bildirimi üç ana değişikliği duyurdu. Değişiklikler 27 Mayıs Pekin saatiyle 00:00'da, yani 26 Mayıs UTC 16:00'da yürürlüğe girdi.
1. Bağlam uzunluğundan bağımsız sabit fiyat
Eski modelde fiyat kademeliydi:
- 32K'ya kadar temel oran
- 32K - 256K arası daha yüksek oran
- 256K üzeri daha pahalı uzun bağlam katmanı
Yeni modelde giriş, çıkış ve önbelleğe alınmış giriş için tek fiyat var. Bu, özellikle 200K+ bağlam kullanan uygulamalarda maliyet hesaplamasını ciddi şekilde basitleştiriyor.
2. Promosyon değil, yeni liste fiyatı
Duyuruda "Kalıcı Fiyat İndirimi" ve "tüm model fiyatlandırma sistemini kalıcı olarak yenileme" ifadeleri geçiyor. Son kullanma tarihi veya kampanya süresi belirtilmiyor.
Bu nedenle maliyet planlamasında yeni oranları geçici indirim gibi değil, yeni baz fiyat gibi ele almak daha doğru.
3. Jeton Planı kredileri sıfırlandı
Xiaomi'nin ön ödemeli kota sistemi olan Jeton Planı için:
- Kota 5 ila 8 kat artırıldı.
- Geçerlilik süresi içindeki daha önce kullanılan krediler iade edildi.
- Plan süresi uzatılmadı.
Yani mevcut planınız varsa daha fazla kullanım hakkınız var, ancak daha uzun süre yok.
"Yüzde 99'a varan indirim" iddiası özellikle 256K+ giriş kullanan uzun bağlam iş yükleri için geçerli. Temel katmanda kalan kısa istemlerde indirim daha küçük, ancak yine de maliyet avantajı yaratıyor.
Yeni Kalıcı Fiyat Listesi
1 milyon jeton başına fiyatlandırma:
| Model | Giriş | Çıkış | Önbelleğe Alınan | Bağlam |
|---|---|---|---|---|
| MiMo V2.5 Pro | $1.00 | $3.00 | $0.20 | 1M jeton |
| MiMo V2 Flash | ~$0.10 | ~$0.40 | $0.02 | 256K jeton |
Uygulama geliştirirken dikkat edilmesi gereken noktalar:
- Önbelleğe alınmış giriş oranı V2.5 Pro için 0,20$/M. Bu, normal girişten 5 kat ucuz.
- 1M bağlam penceresi ana fark. ABD merkezli birçok öncü model 200K - 400K aralığında kalırken MiMo V2.5 Pro 1M jetonluk pencere sunuyor.
- V2.5 Omni ve TTS varyantları ayrıca doğrulanmalı. Xiaomi duyuruda bunlardan bahsediyor, ancak ayrıntılı tablo vermiyor.
Eski fiyatlandırma referansı için MiMo V2-Pro & Omni fiyatlandırma kılavuzumuza bakabilirsiniz.
Maliyet Hesaplama Formülü
Üretim maliyetini hızlı hesaplamak için şu formülü kullanabilirsiniz:
toplam_maliyet =
(giriş_jetonu / 1_000_000) * giriş_fiyatı +
(çıkış_jetonu / 1_000_000) * çıkış_fiyatı +
(önbellek_jetonu / 1_000_000) * önbellek_fiyatı
MiMo V2.5 Pro için:
giriş_fiyatı = 1.00
çıkış_fiyatı = 3.00
önbellek_fiyatı = 0.20
Örnek:
800K giriş + 1K çıkış
(800_000 / 1_000_000) * 1.00 +
(1_000 / 1_000_000) * 3.00
= 0.80 + 0.003
= 0.803$
Bu örnek, tek bir uzun belge RAG çağrısının yaklaşık maliyetini gösterir.
MiMo V2.5'in Fiyat Dışındaki Pratik Etkileri
27 Mayıs duyurusu fiyat odaklı olsa da, V2.5 aynı zamanda V2-Pro'ya göre bazı üretim tarafı iyileştirmeler getiriyor.
Daha uzun pratik bağlam
V2.5 Pro 1M jetonluk teorik pencereyi koruyor. Xiaomi, özellikle 200K - 800K aralığında alım kalitesini iyileştirdiğini belirtiyor. Uzun belge veya depo geneli analizlerde bu aralık kritik.
Daha iyi araç çağırma uyumluluğu
V2-Pro'da paralel araç çağrıları ve akışlı yanıtlarda hatalı JSON dönebilme sorunları vardı. V2.5 bu sorunları azaltıyor, ancak tamamen ortadan kaldırdığı varsayılmamalı.
Üretimde yine de JSON şema doğrulaması yapın:
{
"type": "object",
"required": ["action", "payload"],
"properties": {
"action": {
"type": "string"
},
"payload": {
"type": "object"
}
}
}
Daha güncel eğitim verisi
V2.5, 2026'nın ilk çeyreğine kadar olan verilerle eğitildi. Bilgi kesme noktası V2-Pro'ya göre yaklaşık üç ay daha güncel.
MiMo V2.5 Diğer Modellerle Nasıl Karşılaştırılır?
Mayıs 2026 itibarıyla öne çıkan API seçenekleri:
| Model | Giriş ($/M Jeton) | Çıkış ($/M Jeton) | Bağlam |
|---|---|---|---|
| Xiaomi MiMo V2.5 Pro | $1.00 | $3.00 | 1M |
| DeepSeek V4-Pro | $0.435 | $0.87 | 128K |
| GPT-5.5 | $5.00 | $30.00 | 200K |
| Claude Opus 4.7 | $3.00 | $15.00 | 200K |
| Gemini 3.5 Flash | ~$1.50 | ~$9.00 | 1M |
Pratik yorum:
- Sadece jeton başına maliyete bakıyorsanız DeepSeek V4-Pro daha ucuz.
- 1M bağlam gerekiyorsa MiMo V2.5 daha avantajlı hale geliyor.
- MiMo V2.5, girişte GPT-5.5'ten 5 kat, çıkışta 10 kat ucuz. Artificial Analysis'e göre karşılaştırılabilir benchmark performansı sunuyor.
DeepSeek tarafındaki karşılaştırma için DeepSeek V4-Pro %75 Fiyat İndirimi Artık Kalıcı yazısına bakabilirsiniz.
Üç İş Yükü İçin Yeni Fatura Örnekleri
Aşağıdaki hesaplamalar yeni kalıcı oranlara göre yapılmıştır.
1. Kurumsal PDF'ler Üzerinde Uzun Belge RAG
Varsayım:
- Günde 50.000 sorgu
- Sorgu başına 800K giriş bağlamı
- 1K çıkış
Eski uzun bağlam katmanı yaklaşık etkin 50$/M varsayılırsa:
eski aylık maliyet ≈ 60.000$
yeni aylık maliyet ≈ 1.225$
tasarruf ≈ 58.775$
Bu, MiMo V2.5'in en güçlü kullanım alanı: çok uzun belgeleri özetleyici veya chunk zinciriyle sıkıştırmadan doğrudan modele göndermek.
2. Kod İnceleme Ajanı
Varsayım:
- Günde 5.000 pull request
- PR başına 30K depo bağlamı
- 2K yorum çıkışı
GPT-5.5 aylık maliyet ≈ 5.250$
MiMo V2.5 aylık maliyet ≈ 510$
tasarruf ≈ 4.740$
Depo geneli bağlam, refactor önerileri ve statik analiz destekli ajanlar için yeniden maliyetlendirme yapılmalı.
3. Müşteri Destek Sohbet Botu
Varsayım:
- Günde 200.000 dönüş
- 4K sistem istemi
- 300 çıkış jetonu
Claude Opus 4.7 aylık maliyet ≈ 11.250$
MiMo V2.5 aylık maliyet ≈ 805$
tasarruf ≈ 10.445$
Burada önbelleğe alınmış sistem istemi kullanmak maliyeti daha da düşürebilir.
Önbellek İsabetlerini Kullanma
MiMo V2.5 Pro'da önbelleğe alınmış giriş oranı:
normal giriş: 1.00$/M
önbelleğe alınmış giriş: 0.20$/M
Örnek senaryo:
- 6.000 jetonluk sabit sistem istemi
- Günde 80.000 sohbet dönüşü
- Ortalama kullanıcı mesajı: 250 giriş jetonu
- Ortalama yanıt: 600 çıkış jetonu
Önbellek yoksa:
80.000 * 6.250 * 1.00 / 1.000.000
= günlük 500$ giriş maliyeti
Sistem istemi ön ekinde %60 önbellek isabeti varsa:
80.000 *
(
250 * 1.00 +
6.000 * (0.6 * 0.20 + 0.4 * 1.00)
) / 1.000.000
≈ günlük 271$
Yaklaşık %46 düşüş sağlar.
Önbellek isabetini artırmak için:
- Sistem istemini mümkün olduğunca sabit tutun.
- İstek başına değişen timestamp, request ID veya kullanıcıya özel dinamik verileri ön eke koymayın.
- RAG bağlamını kararlı sırayla ekleyin.
- Aynı araç tanımlarını aynı sırayla gönderin.
MiMo V2.5 Ne Zaman Doğru Seçim?
İyi kullanım alanları
- Uzun belge RAG
- Hukuki veya finansal PDF analizi
- Kod tabanı geneli ajanlar
- Depo geneli refactor önerileri
- Büyük bağlamlı karşılaştırmalı analiz
- Yüksek hacimli belge işleme
1M bağlam penceresi ve sabit fiyatlandırma bu alanlarda doğrudan avantaj sağlar.
Prompt caching stratejileri için Prompt önbelleklemenin LLM performansını nasıl süper şarj ettiğini ve maliyetleri nasıl azalttığını okuyabilirsiniz.
Dikkatli kullanılması gereken alanlar
- Saniye altı yanıt isteyen sohbet uygulamaları
- Otomatik tamamlama
- Yazım önerisi
- Çok düşük gecikmeli etkileşimli arayüzler
MiMo V2.5 Pro en hızlı ilk jeton model olmayabilir. Bu alanlarda DeepSeek V4-Flash veya Gemini 3.5 Flash daha iyi gecikme profili sunabilir.
Üretim uyarıları
- Veri yerleşimi: Çağrılar Xiaomi'nin Çin altyapısı üzerinden yönlendirilir.
- Operasyonel geçmiş: Xiaomi'nin birinci taraf API geçmişi ABD merkezli öncü modeller kadar uzun değildir.
- Toplayıcı kullanımı: SLA odaklı üretim için OpenRouter veya benzer bir toplayıcı değerlendirilebilir.
- Fonksiyon çağırma: OpenAI uyumluluğu şema düzeyinde iyi olsa da, akışlı araç argümanları ve paralel tool call senaryoları test edilmelidir.
V2-Pro lansman bağlamı için Xiaomi Kendi Yapay Zeka Modelini Piyasaya Sürdü ve OpenRouter'da Ücretsiz yazısına bakabilirsiniz. Ücretsiz başlangıç için Xiaomi MiMo Orbit ücretsiz 100T jeton programı uygunluk ve kayıt adımlarını kapsar.
MiMo V2.5'i Apidog ile Test Etme
Üretim trafiğini MiMo V2.5'e taşımadan önce entegrasyonu izole bir test ortamında doğrulayın.
Apidog ile MiMo API anahtarınızı kullanarak https://platform.xiaomimimo.com/v1 adresine OpenAI uyumlu Chat Completions isteği gönderebilirsiniz.
Örnek istek:
curl https://platform.xiaomimimo.com/v1/chat/completions \
-H "Authorization: Bearer $MIMO_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "mimo-v2.5-pro",
"messages": [
{
"role": "system",
"content": "Kısa ve teknik yanıt ver."
},
{
"role": "user",
"content": "Bu API yanıtını JSON şeması açısından kontrol et."
}
]
}'
Apidog içinde önerilen test akışı:
- OpenAI Chat Completions şemasını içe aktarın.
- Base URL değerini şu şekilde değiştirin:
https://platform.xiaomimimo.com/v1
- Authorization header ekleyin:
Authorization: Bearer {{MIMO_API_KEY}}
- V2.5 Pro'dan beklenen "golden response" çıktıları kaydedin.
- Her istem değişikliğinde aynı testleri tekrar çalıştırın.
-
tool_callsalanlarını JSON Schema ile doğrulayın. - Aynı girişleri mevcut modelinizle karşılaştırın: GPT-5.5, Claude, DeepSeek V4-Pro vb.
Apidog'u indirin, OpenAI Chat Completions şemasını içe aktarın, base URL'yi değiştirin ve birkaç dakika içinde V2.5 test donanımı kurun. Benzer iş akışını DeepSeek V4 API nasıl kullanılır yazısında da kullanmıştık.
2026 LLM Fiyat Savaşı Ne Anlama Geliyor?
MiMo V2.5, Çin laboratuvarlarından gelen kalıcı fiyat indirimlerinin son örneklerinden biri. DeepSeek 22 Mayıs'ta V4-Pro fiyatını kalıcı olarak liste fiyatının dörtte birine indirdi. Kimi K2 daha önce indirim yapmıştı. OpenAI O3 ise Şubat'ta %80 fiyat düşüşü gördü.
Ortaya çıkan desen:
- Çin laboratuvarları fiyat üzerinden agresif rekabet ediyor.
- ABD laboratuvarları yetenek, paketleme ve ekosistem üzerinden rekabet ediyor.
- Benchmark farkı daraldıkça her iş yükü yeniden test edilmeli.
Artificial Analysis'e göre MiMo V2.5, birçok kodlama ve akıl yürütme görevinde GPT-5.5'e tek haneli yüzde puanlarla yakın görünüyor. Bu, "varsayılan pahalı model" stratejisinin artık daha fazla doğrulama gerektirdiği anlamına geliyor.
Daha geniş bağlam için:
- DeepSeek V4-Pro kalıcı fiyat indirimi
- Kimi K2 API fiyatlandırması
- OpenAI O3 fiyat düşüşü
- Gemini 3.0 API maliyeti
- Tam Claude API maliyet dökümü
- MiMo-7B-RL benchmark'ları
Uygulamanız İçin Sonraki Adımlar
MiMo V2.5 indirimi, özellikle 1M bağlam gerektiren iş yükleri için maliyet modelini değiştiriyor. Eğer uzun belge RAG, depo geneli kod ajanları veya 200K+ bağlam kullanan herhangi bir sistemi maliyet nedeniyle ertelediyseniz, yeniden hesaplama zamanı.
Uygulanabilir kontrol listesi:
- Son 30 günlük token kullanımınızı çıkarın.
- En yüksek maliyetli üç iş yükünü belirleyin.
- Bu iş yüklerini MiMo V2.5'in yeni fiyatlarıyla yeniden hesaplayın.
- Mevcut modeliniz ve MiMo V2.5 Pro arasında en az 100 örnekli kalite testi yapın.
- Tool call, JSON output ve streaming senaryolarını ayrı ayrı doğrulayın.
- Apidog içinde regresyon test paketi kurun.
- Sadece kalite, gecikme ve maliyet kabul edilebilir olduğunda trafik yönlendirin.
Fiyat tabanı tekrar değişti. Uzun bağlamlı uygulamaları buna göre yeniden tasarlayın.



Top comments (0)