Google, Gemini 3.5 Flash'i 19 Mayıs 2026'da piyasaya sürdü. Bu model, yeni 3.5 ailesinin hızlı ve düşük maliyetli varyantıdır. Gemini 3.5 Pro Haziran 2026 için duyuruldu; ancak bugün üretim iş yüklerinde kullanabileceğiniz 3.5 modeli Flash'tir.
Flash; uzun aracı döngüleri, terminal otomasyonu, çoklu dosya kodlama, çok modlu belge analizi ve akışlı sohbet gibi pratik iş yükleri için tasarlanmıştır. Google'a göre çıktı belirteçlerinde diğer öncü modellere kıyasla yaklaşık 4 kat daha hızlıdır ve görev başına maliyeti onların yarısından daha düşüktür.
Bu rehberde Gemini 3.5 Flash'in ne olduğunu, 3.x serisine göre nelerin değiştiğini, hangi karşılaştırma ölçütlerinde öne çıktığını, API üzerinden nasıl kullanılacağını ve yapay zeka uç noktalarını test etmek için Apidog gibi araçlarla nasıl doğrulanacağını ele alacağız.
Gemini 3.5 Flash hakkında kısa bilgiler
| Alan | Değer |
|---|---|
| Yayın tarihi | 19 Mayıs 2026 |
| Varyant | Gemini 3.5 Flash |
| Pro durumu | Gemini 3.5 Pro Haziran 2026'da geliyor |
| Bağlam penceresi | 1M belirteç giriş, 64K çıkış |
| Modaliteler | Metin, görseller, kod, grafik oluşturma |
| Öne çıkan benchmark'lar | %76,2 Terminal-Bench 2.1, %84,2 CharXiv Akıl Yürütme, %83,6 MCP Atlas, GDPval-AA'da 1656 Elo |
| Hız | Diğer öncü modellere göre çıktı belirteci/saniye bazında ~4 kat daha hızlı |
| Maliyet | Aracılık görevlerinde karşılaştırılabilir öncü modellerin maliyetinin yarısından daha az |
| API model adı | gemini-3.5-flash |
| Erişim | Gemini uygulaması, Arama'da Yapay Zeka Modu, Google Antigravity, Gemini API, AI Studio, Android Studio, Gemini Enterprise |
Ücretsiz katman sınırları ve gerçek maliyet senaryoları dahil olmak üzere ayrıntılı fiyatlandırma için Gemini 3.5 Flash fiyatlandırma kılavuzumuza bakabilirsiniz.
3.5 Flash'te 3 ve 3.1'e göre neler değişti?
Gemini 3.5 Flash, Gemini 3 Flash ve Gemini 3.1 Pro serilerinin üzerine beş pratik iyileştirme getiriyor:
- Aracılık yürütmesi daha kararlı. Daha uzun görev zincirlerinde bağlamı korur. Araç çağrılarını doğru sırada çalıştırır. Alt aracı gönderme, geçici çözüm değil, birinci sınıf yetenek olarak konumlandırılmıştır.
- Kodlama çıktısı daha yoğun. Çoklu dosya yeniden düzenlemeleri, uzun refactor işleri ve CLI tabanlı akışlarda 3.x serisine göre daha kullanışlıdır.
- Grafik üretimi doğrudan modele taşındı. Etkileşimli web UI, SVG ve satır içi diyagramlar ayrı bir görsel modele yönlendirilmeden üretilebilir.
- Çıktı hızı arttı. Google, diğer öncü modellere göre yaklaşık 4 kat daha yüksek belirteç/saniye iddia ediyor. Bu özellikle streaming UI tasarımını etkiler.
- Güvenlik önlemleri genişletildi. Daha güçlü siber ve KBRN güvenlik önlemleri, ayrıca modelin neden reddettiğini veya yönlendirdiğini açıklamaya yardımcı olan yorumlanabilirlik araçları eklendi.
Bu yönelim net: Google, Flash'i sadece sohbet için değil, üretimde çalışan aracı iş yükleri için optimize ediyor. Bu, OpenAI ve Anthropic'in GPT-5.5 ve Claude Opus 4.7 ile izlediği yöne benzer.
Gemini 3.5 Flash karşılaştırma ölçütleri
Google'ın yayınladığı sayılara göre Flash, özellikle araç kullanımı, grafik akıl yürütme ve uzun bağlamlı bilgi alma tarafında güçlüdür.
| Karşılaştırma ölçütü | Ne test ediyor? | Gemini 3.5 Flash |
|---|---|---|
| Terminal-Bench 2.1 | Uzun vadeli CLI iş akışları | %76,2 |
| MCP Atlas | Çoklu araç koordinasyonu | %83,6 |
| CharXiv Akıl Yürütme | Grafik ve diyagram yorumlama | %84,2 |
| GDPval-AA | Genel aracılık değeri | 1656 Elo |
| MRCR v2, 1M bağlam | Uzun bağlamlı bilgi alma | Google'ın tablosunun zirvesi |
Flash'in öne çıktığı alanlar:
- Grafik akıl yürütme
- Çoklu araç koordinasyonu
- Uzun bağlamlı bilgi alma
- Düşük maliyetli aracı döngüleri
- Akışlı kullanıcı deneyimleri
Daha zayıf kaldığı alan ise saf SWE-Bench Verified tarafıdır. Opus 4.7 ve GPT-5.5 tek atışlık hata düzeltmelerinde hâlâ yakın rekabet içindedir. Tek KPI'nız izole hata düzeltme ise bu modelleri de test etmelisiniz. Uzun aracı çalıştırmalarında maliyet ve hız öncelikliyse Flash daha cazip hale gelir.
Daha ayrıntılı üç yönlü karşılaştırma için Gemini 3.5 Flash vs GPT-5.5 vs Opus 4.7 yazısına bakabilirsiniz.
Gemini 3.5 model ailesi
Gemini 3.5 Flash
Flash, şu anda kullanılabilir olan 3.5 varyantıdır. AI Studio, Gemini API, Gemini uygulaması, Arama'da Yapay Zeka Modu, Antigravity, Android Studio ve Gemini Enterprise üzerinden erişilebilir.
Lansman gününde bildirilen fiyatlandırma yaklaşık olarak:
- 1 milyon giriş belirteci: 1,50 dolar
- 1 milyon çıkış belirteci: 9,00 dolar
Bu fiyat, geçen yılki 3.1 Flash-Lite seviyesinden yüksek olsa da Pro sınıfı rakiplerden düşüktür. Toplu mod, önbelleğe alınmış giriş ve Vertex oranları için tam fiyatlandırma kılavuzumuza bakabilirsiniz.
Flash'i özellikle şu işlerde değerlendirin:
- Yüksek verimli aracı döngüleri
- Görsel yoğun grafik ve belge anlama
- Gecikmenin önemli olduğu Apidog test betikleri içinde gömülü kullanım
- Çıktı hızının kullanıcıya doğrudan göründüğü streaming sohbet arayüzleri
- Parçalama olmadan 1M belirteçlik belge analizi
Gemini 3.5 Pro
Pro duyuruldu ancak henüz yayınlanmadı. Google, Pro'yu aracı iş yükleri için amiral gemisi varyant olarak konumlandırıyor. Çok saatlik otonom çalışma, derin araştırma veya liderlik tablosunun en üst seviyesi gerekiyorsa Pro hedef model olacaktır.
Pro yayınlanana kadar yükü Flash taşıyor. Pratik sonuç: geliştirmeye başlamak için Pro'yu beklemeniz gerekmiyor.
Nano var mı?
Google, 3.5 Nano varyantı yayınlamadı. Cihaz içi çıkarım hâlâ 3.1 Flash-Lite serisi üzerinde çalışıyor. 3.5 Nano duyurusu için bir sonraki Pixel döngüsüne yakın dönem beklenebilir.
Gemini 3.5 Flash'i nerede kullanabilirsiniz?
Lansman gününde altı erişim yüzeyi duyuruldu:
- Gemini uygulaması: Ücretsiz ve ücretli katmanlarla küresel kullanım.
- Google Arama'da Yapay Zeka Modu: Yanıtlar ve takip soruları.
- Google Antigravity: Google'ın son kullanıcı otomasyonu için aracı platformu.
- Gemini API: AI Studio üzerinden geliştirici erişimi.
- Android Studio: Android geliştiricileri için IDE düzeyinde kodlama yardımı.
- Gemini Enterprise + Aracı Platformu: Kurum genelinde yönetilen aracı çalışma zamanı.
Yeni arayüzlerden biri de Gemini Spark. Spark, hesabınızda 7/24 çalışan kişisel bir aracı olarak konumlandırılmıştır. Arka planda Flash'i kullanır ve Gmail, Takvim ve Drive bağlamınıza bağlanır.
Arama içindeki bilgi aracıları da yenidir. Takip ettiğiniz konularla ilgili güncellemeleri, tekrar sorgu yazmanız gerekmeden bir araya getirir.
Gemini 3.5 Flash'i kullanmaya başlama
Dört pratik yol var. Seçim, kullanım senaryonuza bağlıdır.
1. Gemini uygulaması ile sohbet
gemini.google.com adresini açın, model seçiciden 3.5 Flash seçin ve kullanmaya başlayın.
Bu yol şunlar için uygundur:
- Araştırma
- Yazı taslağı
- Kod örneği üretme
- Görsel analizi
- PDF veya belge özetleme
2. Google AI Studio ile ücretsiz geliştirme
ai.google.dev adresine gidin, oturum açın ve ücretsiz günlük kotaya sahip API anahtarı oluşturun. Flash, lansmanda günde yaklaşık 1.500 istek ile ücretsiz katmanda yer alıyor.
Daha önce Google Gemini API'yi kullandıysanız, akış aynıdır:
- API anahtarı oluşturun.
- Ortam değişkeni olarak ayarlayın.
- SDK veya REST isteğinde model adını
gemini-3.5-flashyapın. - İsteği gönderin.
- Yanıtı gecikme, maliyet ve çıktı kalitesi açısından ölçün.
Örnek ortam değişkeni:
export GEMINI_API_KEY="YOUR_API_KEY"
Model adını kodda sabit tutmak yerine yapılandırma dosyasına almak daha güvenlidir:
GEMINI_MODEL=gemini-3.5-flash
Adım adım anlatım için ücretsiz Gemini API anahtarı kılavuzumuza veya beş ücretsiz yolun tamamı için Flash'e özel ücretsiz kılavuzumuza bakabilirsiniz.
3. Üretimde Gemini API
Üretim iş yükleri, ücretli hesapla aynı uç nokta üzerinden yönlendirilir. Flash'in fiyatlandırması giriş/çıkış belirteci modelini takip eder ve amiral gemisi rakiplerin altında konumlanır.
Basit bir üretim entegrasyonunda kontrol etmeniz gerekenler:
- İstek başına giriş ve çıkış belirteci
- Ortalama ve p95 gecikme
- Streaming yanıt davranışı
- Araç çağrısı şeması
- Hata ve retry stratejisi
- Güvenlik reddi davranışları
Python, Node ve curl örnekleri; streaming, araç kullanımı ve çok modlu desenler için Gemini 3.5 Flash API Nasıl Kullanılır yazısına bakabilirsiniz.
Sisteminize entegre ettiğinizde uç noktayı izole şekilde test edin. Apidog, Flash REST ve streaming uç noktaları için istek/yanıt döngüsünü tek çalışma alanında yönetir. Özellikle araç çağrılarını veya çok modlu payload'ları uçtan uca doğrularken kullanışlıdır.
4. Gemini Enterprise ile yönetilen kullanım
Kurumlar için Gemini Enterprise Aracı Platformu, Flash'i denetim günlükleri, veri yerleşimi ve yönetilen çalışma zamanı ile sunar. Büyük ekipler için tipik akış şudur:
- Geliştirici API'si ile prototip oluşturun.
- Değerlendirme seti hazırlayın.
- Güvenlik ve veri gereksinimlerini doğrulayın.
- Gemini Enterprise yoluna taşıyın.
Gemini 3.5 Flash gerçekte ne işe yarar?
İlk halka açık testlerden çıkan desenler net.
Uzun aracı döngüleri
Flash, araç çağrılarıyla çok adımlı web araştırması veya terminal tabanlı işlerde daha uzun zincirleri taşıyabilir. %83,6 MCP Atlas puanı, çoklu araç koordinasyonu tarafındaki güçlü performansını gösterir.
Test ederken şu metrikleri izleyin:
- Doğru aracı seçme oranı
- Hatalı araç çağrısından toparlanma
- Aynı adımda döngüye girme sıklığı
- Görev başına toplam belirteç maliyeti
Grafik ve belge akıl yürütmesi
%84,2 CharXiv puanı, grafik ve diyagram yorumlama tarafında güçlü olduğunu gösterir. Elle grafik çıkarma pipeline'ları kuruyorsanız, bazı işleri tek model çağrısına indirmek mümkün olabilir.
Örnek kullanım alanları:
- Rapor tablosundan veri çıkarma
- Grafik trendi açıklama
- PDF içindeki şekilleri yorumlama
- Teknik diyagramdan özet üretme
Etkileşimli UI oluşturma
Flash, tek istemle HTML, etkileşimli bileşenler ve satır içi grafikler üretebilir. 3.1 Flash-Lite ile kıyaslandığında grafik kalitesindeki sıçrama en belirgin yükseltmelerden biridir.
Örnek istem:
Bir API kullanım kontrol paneli üret.
HTML, CSS ve basit JavaScript tek dosyada olsun.
Şunları göster:
- Günlük istek sayısı
- Ortalama gecikme
- Hata oranı
- Model başına maliyet
Maliyet odaklı üretim iş yükleri
Google'ın "diğer öncü modellerin maliyetinin yarısından daha az" ifadesi özellikle aracılık görevleri için geçerlidir. Pazarlama matematiği bir kenara bırakıldığında bile, uzun aracı çalıştırmalarında Flash'in görev başına maliyeti Opus 4.7 veya GPT-5.5 seviyesinden daha düşüktür. Sayısal döküm için fiyatlandırma analizimize bakabilirsiniz.
Flash'in hâlâ zayıf olduğu noktalar
Hiçbir model her iş için en iyi seçenek değildir. İlk gün itibarıyla üç önemli sınırlama var:
- Saf SWE-Bench Verified: Opus 4.7'nin %87,6 skoru, izole hata düzeltme benchmark'larında hâlâ önde olduğunu gösteriyor. Tek KPI'nız tek issue çözümü ise Flash'i yan yana test edin.
- Ses: Gemini'nin ses yığını ayrıdır. Ses odaklı iş yükleri için Grok Voice vs GPT-Realtime karşılaştırmasına bakabilirsiniz.
- Araç ekosistemi olgunluğu: OpenAI ve Anthropic, üçüncü taraf adaptörlerinde hâlâ daha olgun ekosistemlere sahip. Google, Antigravity ile yetişiyor; ancak ekosistem daha genç.
Gemini 3.5 Flash'i doğru şekilde test etme
Yeni bir modeli üretim sisteminize eklerken iki şey kritik olur:
- Yanıt şekli kararlılığı
- Araç çağrılarının doğruluğu
Küçük ama tekrarlanabilir bir değerlendirme düzeni kurun:
- Temsili istemleri seçin.
- Aynı istemleri
gemini-3.5-flashve mevcut modelinizle çalıştırın. - Gecikme, belirteç maliyeti ve görev başarısı üzerinden puanlayın.
- Araç çağrısı şeması kaymalarını izleyin.
- Streaming yanıtları UI tarafında test edin.
- Güvenlik reddi ve hata senaryolarını yeniden çalıştırın.
Örnek değerlendirme tablosu:
| Test | Mevcut model | Gemini 3.5 Flash | Not |
|---|---|---|---|
| 10 adımlı araç görevi | Başarılı / başarısız | Başarılı / başarısız | Araç sırası kontrol edilmeli |
| PDF grafik yorumlama | Skor | Skor | Sayısal çıkarım doğrulanmalı |
| Streaming sohbet | p95 gecikme | p95 gecikme | UI render kapasitesi ölçülmeli |
| Kod refactor | Test sonucu | Test sonucu | Unit test ile doğrulanmalı |
- ve 3. adımlar için Apidog, streaming dahil Flash API uç noktaları için kaydedilmiş test paketleri oluşturmanıza yardımcı olur. Aynı istemleri model sürümleri arasında yeniden oynatabilir ve çıktıları karşılaştırabilirsiniz. Yerel olarak kurmak için Apidog'u indirin.
Gemini 3.1'den 3.5 Flash'e geçiş ipuçları
Halihazırda 3.1 kullanıyorsanız, çoğu SDK'da geçiş tek satırlık model adı değişikliğidir:
- model: "gemini-3.1-flash"
+ model: "gemini-3.5-flash"
Dikkat etmeniz gereken noktalar:
- Belirteç bütçeleri sabit: 1M giriş / 64K çıkış devam eder.
- Araç şemaları sabit: Mevcut işlev tanımlarınız değişmeden aktarılabilir.
- Çıktı hızı artar: Streaming UI'nız bu hızı işleyemiyorsa istemci tarafında throttle gerekebilir.
- Fiyatlandırma farklıdır: Trafiği taşımadan önce Flash fiyatlandırma kılavuzu ile maliyet tahminlerini güncelleyin.
- Güvenlik yanıtları daha katı olabilir: Farklı reddetme desenleri bekleyin ve kırmızı takım testlerinizi yeniden çalıştırın.
Daha ayrıntılı geçiş notları için Google Gemini 3 API kılavuzu, SDK desenini ayrıntılı olarak ele alır.
SSS
Gemini 3.5 Pro ne zaman kullanıma sunulacak?
Google, 19 Mayıs 2026'da Pro'nun "gelecek ay" kullanıma sunulacağını duyurdu. AI Studio, Gemini API ve Gemini Enterprise genelinde Haziran 2026'da genel kullanılabilirlik bekleniyor. O zamana kadar çağırabileceğiniz tek 3.5 varyantı Flash'tir.
Gemini 3.5 Flash'i ücretsiz kullanabilir miyim?
Evet, günlük kotalar dahilinde. Gemini uygulamasının standart katmanı ve API anahtarına sahip AI Studio, ödeme yapmadan Flash erişimi sağlar. Beş ücretsiz yol için Flash ücretsiz kılavuzumuza ve Ücretsiz Sınırsız Gemini API Edinin yazımıza bakabilirsiniz.
Gemini 3.5 Flash işlev çağrısını destekliyor mu?
Evet. Araç çağırma ve alt aracı gönderme birinci sınıf yeteneklerdir. %83,6 MCP Atlas puanı bunun başlıca göstergesidir.
Flash, Opus 4.7 ve GPT-5.5 ile nasıl karşılaştırılır?
Flash; maliyet, çıktı hızı ve grafik akıl yürütmede öndedir. Opus 4.7, SWE-Bench Pro ve uzun biçimli yazımda hâlâ biraz önde olabilir. GPT-5.5 belirteç verimliliğinde güçlüdür. İş yüküne göre ayrıntılı döküm için üç yönlü karşılaştırmayı inceleyin.
Gemini 3.5 Flash'i yerel olarak çalıştırabilir miyim?
Hayır. Açık ağırlık sürümü yoktur. Yerel çıkarım için 2026'nın en iyi yerel LLM'leri listesini inceleyebilirsiniz.
Gemini 3.5 Flash, Cursor ile çalışıyor mu?
Evet, standart Gemini API üzerinden çalışır. Desen, Cursor ile Gemini 3.0 Pro kullanımındakiyle aynıdır.
Flash için API model adı nedir?
Model adı gemini-3.5-flash. SDK'da veya REST uç noktasında bu dizeyi kullanın.
Sisteminiz için pratik karar rehberi
Bugün üretimde bir yapay zeka özelliği çalıştırıyorsanız, kısa karar matrisi şöyle:
- 3.1 Flash kullanıyorsanız: Bu hafta 3.5 Flash'i yan yana test edin. Streaming arayüzlerde sadece çıktı hızı bile geçişi anlamlı hale getirebilir.
- Opus 4.7 veya GPT-5.5 kullanıyorsanız: Flash'e karşı maliyet ve kalite değerlendirmesi yapın. Yoğun aracı iş yüklerinde trafik bölme mantıklı olabilir.
- Yeni bir aracı döngüsü kuruyorsanız: Flash ile başlayın. Güvenilir aracı performansı ve düşük maliyet dengesi güçlüdür.
- Yoğun çok modlu iş yükünüz varsa: Grafik ve belge akıl yürütme skorları nedeniyle Flash'i hemen test edin.
Hangi yolu seçerseniz seçin, modeli tek başına ürün olarak değil, uçtan uca test edilmesi gereken bir hattın bileşeni olarak ele alın. Apidog, özellikle Gemini API test tarafını kapsar. Döngünün geri kalanı; istem tasarımı, araç bağlantısı, değerlendirme betikleri ve üretim izleme tarafında sizin mimarinize bağlıdır.



Top comments (0)