DEV Community

Cover image for ChatGPT Görseller 2.0 Yenilikleri
Tobias Hoffmann
Tobias Hoffmann

Posted on • Originally published at apidog.com

ChatGPT Görseller 2.0 Yenilikleri

OpenAI, 21 Nisan 2026'da **gpt-image-2** modelini temel alan ChatGPT Resimleri 2.0'ı kullanıma açtı. Bu model, isteminizi analiz edip düzeni planlar, çok dilli ve keskin metinler üretir ve tek seferde 10 adede kadar görsel oluşturabilir; tümü 2.000 piksele kadar genişlikte ve eski modellere kıyasla çok daha esnek en-boy oranlarıyla çalışır.

Apidog'u bugün deneyin

Geliştiriciler için en önemli güncelleme arayüz değil; esas yenilik, gpt-image-2 modelinin OpenAI API üzerinden "düşünme" modu, belirteç bazlı fiyatlandırma ve mevcut uç nokta düzeniyle sunulmasıdır.

Bu rehberde, modeldeki yenilikler, API fiyatlandırması, uçtan uca çağrı adımları ve Apidog ile kod yazmadan test işlemlerine odaklanıyoruz. Eski görsel API'lerinde metin bozukluğu veya 1024 piksel çözünürlük limiti nedeniyle bıraktıysanız, şimdi tekrar denemenin zamanı.

gpt-image-2 nedir?

gpt-image-2, 21 Nisan 2026'da ChatGPT Resimleri 2.0 ile birlikte yayımlanan OpenAI'ın ikinci nesil görsel üretim modelidir. API'de önceki gpt-image-1 ailesinin yerini alır ve ChatGPT'nin hem web hem mobilde görsel üretmesine imkan tanır.

Önceki OpenAI görsel modellerine göre üç temel fark öne çıkıyor:

  • Okunabilir metin desteği: Artık küçük UI etiketleri, logolar, altyazılar ve Latin dışı alfabelerde (Japonca, Korece, Çince, Hintçe, Bengalce) bile net metin üretimi mümkün.
  • Akıl yürütme (düşünme) modu: thinking bayrağı ile etkinleşen bu mod, kompozisyon planlar, nesne sayısını ve yerleşimi kontrol eder. Böylece diyagramlarda yanlış nesne/etiket sayısını azaltır.
  • Çözünürlük ve tuval esnekliği: 2.000 piksele kadar uzun kenar ve 3:1, 1:3 gibi uç en-boy oranları ile slayt kapağı, afiş, dikey video gibi çıktılar doğrudan üretilebilir.

OpenAI, bu modeli "yaratıcı oyuncaktan" iş akışında kullanılabilen bir araç haline getirmeyi hedefliyor: dergi sayfaları, infografikler, slaytlar ve hatta manga panelleri için pratik çıktı.

gpt-image-1'e kıyasla ne değişti?

API seviyesinde önemli farklar ve geliştirmeler şöyle:

Özellik gpt-image-1 gpt-image-2
Maksimum çözünürlük 1024 piksel Uzun kenarda 2.000 piksel
En boy oranları 1:1, 3:2, 2:3 1:1, 3:2, 2:3, 16:9, 9:16, 3:1, 1:3
İstek başına görsel 1 Stil tutarlılığı ile 10 adede kadar
Metin oluşturma Yalnızca İngilizce, genellikle bozuk CJK ve Hint betikleri dahil çok dilli
Akıl yürütme modu Hayır Evet (thinking bayrağı)
Oluşturma sırasında web araması Hayır Evet, düşünme modunda

Toplu üretim özelliği kritik: Tek bir istemle, kompozisyonu ve paleti paylaşan 10 varyasyon döndürebilirsiniz. Bu, ürün ekiplerinin birden fazla kahraman görselini hızlıca üretmesi için idealdir.

Erişim ve fiyatlandırma

Kademeli olarak erişime açılıyor:

  • ChatGPT Ücretsiz: Standart gpt-image-2 kullanır.
  • ChatGPT Plus, Pro ve Business: Düşünme modu, daha uzun akıl yürütme ve oluşturma sırasında web araması içerir.
  • API geliştiricileri: Her iki mod da gpt-image-2 model kimliğiyle kullanılabilir. Lansmandan sonra API'de kademeli olarak açıldı.

OpenAI API fiyatlandırma belirteç bazlıdır: Milyon giriş metni belirteci $5, çıkış metni $10, giriş görseli $8, çıkış görseli $30. 1024x1024 yüksek kalite tek görsel için yaklaşık $0.21. Yeni çözünürlük ve akıl yürütme adımı nedeniyle fiyat %60 artışlıdır.

Dikkat: Düşünme modu, ekstra akıl yürütme belirteçleriyle faturalandırılır. Karmaşık diyagramlar düz illüstrasyonlardan pahalıya gelir. Bütçenizi düz görsel başına değil, belirteç bazında planlayın.

API'yi çağırma

API uç noktası images/generations olarak kalır. Temel bir örnek:

curl https://api.openai.com/v1/images/generations \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "A clean product hero for an API testing platform, dark background, soft cyan lighting, a laptop showing a JSON response, sharp small-text UI labels readable",
    "size": "1536x1024",
    "n": 4,
    "quality": "high"
  }'
Enter fullscreen mode Exit fullscreen mode

Düşünme modunu eklemek için thinking parametresini kullanın:

curl https://api.openai.com/v1/images/generations \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "A four-panel infographic explaining OAuth 2.1 authorization code flow with PKCE. Label every arrow in English and Japanese.",
    "size": "2000x1000",
    "n": 1,
    "quality": "high",
    "thinking": "medium"
  }'
Enter fullscreen mode Exit fullscreen mode

Yanıt, response_format seçiminize göre base64 veya URL olarak döner. Şema, gpt-image-1'den beri değişmedi; mevcut SDK sarmalayıcıları model adını güncelleyince çalışır.

Python için resmi SDK ile örnek:

from openai import OpenAI

client = OpenAI()

result = client.images.generate(
    model="gpt-image-2",
    prompt="Minimalist dashboard UI mockup for a REST client, sentence-case labels, a latency chart in the corner.",
    size="1536x1024",
    n=4,
    quality="high",
)

for i, image in enumerate(result.data):
    with open(f"out_{i}.png", "wb") as f:
        f.write(image.b64_json.encode())  # decode() in practice
Enter fullscreen mode Exit fullscreen mode

İpuçları:

  1. Düşünme modunda low, medium, high seviyeleri var. Özellikle grafik/tablolar için medium iyi bir varsayılan.
  2. n > 1 ile toplu çıktı alınca, stil tek çağrıda tutarlı kalır. Ayrı çağrılarda tutarlılık bozulur; seri üretim için tek çağrıda çoklu görsel alın.

Apidog ile gpt-image-2'yi Test Etme

Komut satırında görsel modelleri test etmek zor; anlık önizleme, pratik istem yönetimi ve sürümlendirme eksik. API istemcisi ile çalışmak işleri kolaylaştırır. Postman gibi araçlara alternatif olarak görsel çıktıları daha iyi yönetebileceğiniz bir çözüm arıyorsanız, Apidog iş akışınızı hızlandırır.

Apidog ile OpenAI OpenAPI spesifikasyonunu içe aktarın, OPENAI_API_KEY'inizi ortam değişkeni olarak ekleyin, prompt'u gövdede düzenleyip gönderin. Görsel yanıtlar satır içi (base64/URL) olarak gelir; farklı en-boy oranı, kalite ve düşünme modlarını varyant olarak kaydedebilir, yan yana test edebilirsiniz.

Önerilen pratik iş akışı:

  1. Apidog koleksiyonunda bir gpt-image-2 isteği oluşturun.
  2. İki ortam tanımlayın: biri thinking: "off", diğeri thinking: "medium".
  3. Aynı prompt'u her ikisinde çalıştırıp çıktıları görsel olarak karşılaştırın; kazananı kütüphanenize ekleyin.
  4. Farklı varlık türleri için (afiş, slayt, infografik) koleksiyonu çatallayın ve her birine özel parametreler ayarlayın.

Ekstra: Görseli oluşturup, aynı testte CDN yükleme gibi zincirli çağrılar tanımlayabilirsiniz. Bunu bash/curl scriptlerinde yönetmek zordur.

Daha akıcı bir API test deneyimi için Apidog'u indirin ve OpenAI anahtarınız ile başlayın; kurulum birkaç dakikada tamamlanır.

gpt-image-2'nin hala zorlandığı alanlar

Model güçlü ama bazı pratik sınırlamalar devam ediyor:

  • Yakın çekim fotogerçekçi yüzler: Özellikle ünlü figürler için hala kararsız; OpenAI çoğu benzer istemi reddediyor.
  • Marka varlıkları: Tam logo, tescilli karakterler gibi detaylar güvenilir üretilemiyor; marka temsilinden çok duygu ve atmosfer için kullanın.
  • Uzun metin blokları: Görselde birkaç yüz karakterden uzun yazılar bozuluyor; model altyazı, başlık ve kısa etiketlere uygun.
  • Oturumlar arası tutarlılık: Toplu üretim tek çağrıda stili korur; ayrı günlerdeki çağrılarda aynı prompt bile farklı sonuçlar verebilir.

Daha kapsamlı analiz için The Decoder'ın değerlendirmesine göz atabilirsiniz.

2026 görsel oluşturma alanındaki karşılaştırma

OpenAI tek oyuncu değil; Google'ın Nano Banana 2 modeli ve bazı açık kaynaklı çok modlu modeller de metin doğruluğuna yaklaşıyor.

Alternatif API'leri incelemek için:

Eğer metin doğruluğu, kompozisyon mantığı ve OpenAI ekosistemiyle entegrasyon önceliğinizse gpt-image-2 avantajlıdır. Düşük maliyet, self-hosting veya ticari çıktı için açık lisans gerekiyorsa açık kaynak çok modlu modellere bakın.

Sıkça Sorulan Sorular

gpt-image-2, ücretsiz ChatGPT katmanında mevcut mu?

Evet, standart mod ücretsiz. Düşünme modu ve gelişmiş akıl yürütme ile web araması ise Plus, Pro ve Business'a özel. API erişimi ayrı; mevcut hız sınırı katmanları geçerlidir.

gpt-image-2 görsel düzenleme ve inpainting destekliyor mu?

Lansman metinden görsele ve toplu/düşünme modlarına odaklı. Görsel + maske ile düzenleme uç noktalarının yeni model kimliğiyle sunulması bekleniyor. Inpainting için gpt-image-2 model sayfasını takip edin.

Desteklenen çözünürlük ve en-boy oranları nedir?

2.000 piksele kadar uzun kenar; 1:1, 3:2, 2:3, 16:9, 9:16, 3:1, 1:3 oranları mevcut. Böylece afiş, dikey video, sosyal medya kareleri ve geniş kırpılmış görseller için ek işleme gerek kalmaz.

gpt-image-2 isteklerini hızlıca nasıl test ederim?

API istemcisi kullanın. Apidog, görselleri satır içi gösterir, prompt'ları koleksiyon değişkeni olarak saklar ve düşünme modlarını karşılaştırmanıza imkan tanır. Komut satırı ekibiyseniz, Postman olmadan API testi rehberimizle kullanabilirsiniz.

API'den bir görselin maliyeti nedir?

1024x1024, yüksek kalite, standart modda ~0,21 USD. Düşünme modu ekstra belirteç ile fiyatı artırır. Detaylı oranlar için OpenAI fiyatlandırma sayfasına bakın.

Model oluştururken web'de arama yapabilir mi?

Evet, düşünme modunda. Model, referans görsel ve gerçekleri çekebilir; bu, doğru sayılarla grafik ve harita üretiminde avantaj sağlar. Standart modda web araması yok.

Top comments (0)