DEV Community

Cover image for Ücretsiz Sınırsız Gemini API Erişimi
Tobias Hoffmann
Tobias Hoffmann

Posted on • Originally published at apidog.com

Ücretsiz Sınırsız Gemini API Erişimi

Google'ın Gemini ailesi, yüksek hacimli iş yükleri için en uygun maliyetli sınır model serilerinden biridir. Gemini 2.5 Pro milyon token başına 1,25 / 10 dolar maliyetle çalışır; Flash varyantları daha ucuzdur. Ancak ücretsiz bir genel uygulama, yan proje veya hackathon prototipi birkaç bin kullanıcıya ulaştığında bu maliyet hızla büyür. Puter.js farklı bir model sunar: Gemini serisini ve açık Gemma modellerini Google API anahtarı olmadan tarayıcıdan kullanırsınız; kullanım maliyeti geliştirici yerine son kullanıcının Puter hesabına yansır.

Apidog'u bugün deneyin

TL;DR

  • Puter.js, Gemini ve Gemma modellerine Google API anahtarı, Google Cloud projesi ve sunucu olmadan erişmenizi sağlar.
  • Desteklenen Gemini modelleri: 2.5 Pro, 2.5 Flash, 2.5 Flash Lite, 2.0 Flash, 2.0 Flash Lite, 3 Flash Önizlemesi ve bazı eski önizlemeler.
  • Desteklenen Gemma modelleri: farklı boyutlarda Gemma 2, 3 ve 4.
  • Kurulum tek bir <script> etiketiyle yapılır.
  • Akış, görüntü girişi, sıcaklık ayarı ve çok turlu sohbetler tarayıcıda çalışır.
  • Son kullanıcı Puter hesabı üzerinden kendi kullanımını karşılar; geliştirici tarafında Google faturası oluşmaz.
  • Puter prototipinizi resmi Gemini API'sine taşımayı planlıyorsanız, karşılaştırmalı testler için Apidog kullanabilirsiniz.

“Ücretsiz sınırsız” model nasıl çalışır?

Puter.js, LLM faturalandırma akışını tersine çevirir. Normalde geliştirici bir Google AI Studio anahtarı tutar ve tüm token maliyetini kendisi öder. Puter'da ise kullanıcı Puter hesabıyla giriş yapar ve çağrı onun bakiyesinden karşılanır.

Geliştirici açısından sonuç:

  • Google Cloud projesi gerekmez.
  • AI Studio API anahtarı tutmazsınız.
  • Sunucu veya proxy yazmanız gerekmez.
  • Kullanım maliyeti sizin hesabınıza yazılmaz.
  • Ölçek, kullanıcıların kendi Puter kullanımına bağlıdır.

Takas noktası şudur: Puter.js tarayıcı önceliklidir. Zamanlanmış arka uç işleri, batch görevleri veya kullanıcı oturumu olmayan servisler için doğrudan resmi Gemini API'si daha uygundur.

Adım 1: Puter.js'i yükleyin

Statik bir sayfada tek CDN etiketi yeterlidir:

<script src="https://js.puter.com/v2/"></script>
Enter fullscreen mode Exit fullscreen mode

Tam bir HTML örneği:

<!DOCTYPE html>
<html lang="tr">
<body>
  <script src="https://js.puter.com/v2/"></script>
</body>
</html>
Enter fullscreen mode Exit fullscreen mode

Paketlenmiş bir uygulamada kullanmak isterseniz:

npm install @heyputer/puter.js
Enter fullscreen mode Exit fullscreen mode
import { puter } from '@heyputer/puter.js';
Enter fullscreen mode Exit fullscreen mode

Adım 2: Model seçin

Puter üzerinden kullanabileceğiniz temel Gemini/Gemma seçenekleri:

Model Kimliği Ne zaman kullanılır?
google/gemini-2.5-pro Karmaşık akıl yürütme, uzun analizler, zor karar görevleri
google/gemini-2.5-flash Genel amaçlı sohbet, Soru-Cevap, içerik üretimi
google/gemini-2.5-flash-lite Yüksek hacimli sınıflandırma, etiketleme, kısa yanıtlar
google/gemini-2.0-flash Stabil davranış isteyen üretim senaryoları
google/gemini-3-flash-preview En yeni önizleme özelliklerini denemek
google/gemma-3-27b-it Açık Gemma tabanlı talimat odaklı iş akışları
google/gemma-4-31b-it Daha büyük açık Gemma modeliyle kalite denemeleri

Pratik varsayılan:

google/gemini-2.5-flash
Enter fullscreen mode Exit fullscreen mode

Çoğu uygulamada önce Flash ile başlayın. Yalnızca zor akıl yürütme, kapsamlı analiz veya karmaşık planlama gereken yerlerde Pro'ya geçin. Lite modelleri ise sınıflandırma, etiketleme ve basit Soru-Cevap için daha uygundur.

Adım 3: İlk Gemini çağrısını yapın

Minimum çalışan örnek:

<!DOCTYPE html>
<html lang="tr">
<body>
  <script src="https://js.puter.com/v2/"></script>

  <script>
    puter.ai.chat(
      "Makine öğrenmesini üç cümlede açıklayın.",
      { model: "google/gemini-2.5-flash" }
    ).then(response => {
      puter.print(response);
    });
  </script>
</body>
</html>
Enter fullscreen mode Exit fullscreen mode

Bu dosyayı tarayıcıda açtığınızda:

  1. Puter.js yüklenir.
  2. Kullanıcı gerekirse Puter hesabıyla giriş yapar.
  3. Gemini çağrısı yapılır.
  4. Yanıt sayfaya yazdırılır.

API anahtarı, .env dosyası veya backend gerekmez.

Adım 4: Yanıtı akış olarak alın

Chat UI geliştiriyorsanız yanıtı tek parça beklemek yerine akışla göstermek daha iyi kullanıcı deneyimi sağlar.

const response = await puter.ai.chat(
  "Fotosentezi ayrıntılı olarak açıklayın.",
  {
    model: "google/gemini-2.5-flash",
    stream: true,
  }
);

for await (const part of response) {
  if (part?.text) {
    outputDiv.innerHTML += part.text;
  }
}
Enter fullscreen mode Exit fullscreen mode

Basit bir HTML entegrasyonu:

<div id="output"></div>

<script src="https://js.puter.com/v2/"></script>
<script>
  const outputDiv = document.getElementById("output");

  async function run() {
    const response = await puter.ai.chat(
      "REST API nedir? Kısa ama teknik anlat.",
      {
        model: "google/gemini-2.5-flash",
        stream: true,
      }
    );

    for await (const part of response) {
      if (part?.text) {
        outputDiv.innerHTML += part.text;
      }
    }
  }

  run();
</script>
Enter fullscreen mode Exit fullscreen mode

Her part.text, yanıtın bir parçasıdır. UI'a ekledikçe kullanıcı yanıtın canlı yazıldığını görür.

Adım 5: Görüntü girişi kullanın

Gemini'nin güçlü taraflarından biri çok modlu giriş desteğidir. Puter ile modele bir görüntü URL'si verebilirsiniz:

puter.ai.chat(
  "Bu resimde ne görüyorsunuz? Renkleri, nesneleri ve genel ruh halini açıklayın.",
  "https://assets.puter.site/doge.jpeg",
  { model: "google/gemini-2.5-flash" }
).then(response => {
  puter.print(response);
});
Enter fullscreen mode Exit fullscreen mode

Kullanım alanları:

  • Alt metin üretimi
  • Görsel Soru-Cevap
  • Ekran görüntüsü analizi
  • OCR benzeri iş akışları
  • Erişilebilirlik araçları
  • Ürün görseli etiketleme
  • Diyagram açıklama

Doğal görüntüler ve diyagramlar için Gemini güçlü sonuç verir. Yoğun metin içeren ekran görüntülerinde bazı modeller belirli senaryolarda daha iyi performans gösterebilir; bu nedenle kendi veri tipinizle test etmek önemlidir.

Adım 6: Sıcaklık değerini ayarlayın

temperature, modelin ne kadar deterministik veya yaratıcı davranacağını etkiler.

const response = await puter.ai.chat(
  "Robot bir şef hakkında yaratıcı bir kısa hikaye yaz.",
  {
    model: "google/gemini-2.5-flash",
    temperature: 0.8,
  }
);

console.log(response);
Enter fullscreen mode Exit fullscreen mode

Pratik aralıklar:

  • 0.0–0.3: gerçek odaklı, yapılandırılmış, tekrarlanabilir yanıtlar
  • 0.4–0.7: genel sohbet ve içerik üretimi
  • 0.7–1.0: yaratıcı yazım, fikir üretimi, varyasyon denemeleri

Örneğin JSON üretmesini istiyorsanız düşük sıcaklık kullanın:

const response = await puter.ai.chat(
  `Aşağıdaki metni duygu analizine tabi tut ve sadece JSON döndür:
  "Ürün hızlı geldi ama paketleme kötüydü."`,
  {
    model: "google/gemini-2.5-flash",
    temperature: 0.2,
  }
);
Enter fullscreen mode Exit fullscreen mode

Adım 7: Çok turlu sohbet kurun

Önceki mesajları bir dizi olarak iletin:

const messages = [
  { role: "user", content: "Next.js uygulaması ve Postgres kullanıyorum." },
  { role: "assistant", content: "Anladım. Ne konuda yardıma ihtiyacın var?" },
  { role: "user", content: "Migrationları nasıl yapılandırmalıyım?" },
];

const response = await puter.ai.chat(messages, {
  model: "google/gemini-2.5-pro",
});

console.log(response);
Enter fullscreen mode Exit fullscreen mode

Bir sohbet arayüzünde her turdan sonra geçmişi güncelleyin:

const messages = [];

async function sendMessage(userInput) {
  messages.push({
    role: "user",
    content: userInput,
  });

  const response = await puter.ai.chat(messages, {
    model: "google/gemini-2.5-flash",
  });

  messages.push({
    role: "assistant",
    content: response,
  });

  return response;
}
Enter fullscreen mode Exit fullscreen mode

Bu yapı sayesinde Gemini önceki konuşmayı okuyarak bağlamı korur.

Aynı prompt ile modelleri karşılaştırın

Puter, farklı sağlayıcı modellerini tek arayüzden çağırabildiği için aynı prompt'u birden fazla modelde test edebilirsiniz:

const models = [
  "google/gemini-2.5-flash",
  "claude-sonnet-4-6",
  "gpt-5.5",
  "x-ai/grok-4.3",
];

const prompt = "Bu React bileşenini hooks kullanacak şekilde yeniden düzenle: ...";

for (const model of models) {
  const start = performance.now();

  const response = await puter.ai.chat(prompt, { model });

  const elapsed = performance.now() - start;

  console.log(`${model}: ${elapsed.toFixed(0)}ms`);
  console.log(response);
  console.log("---");
}
Enter fullscreen mode Exit fullscreen mode

Bu yaklaşım özellikle şunlar için işe yarar:

  • Kod üretimi kalitesini karşılaştırma
  • Gecikme ölçümü
  • Uzun yanıt kalitesi
  • Basit sınıflandırma doğruluğu
  • Farklı modellerin aynı veri üzerindeki davranışını görme

Genel pratik: Gemini Flash çoğu durumda hız ve kalite dengesi için iyi bir başlangıçtır. Kodlama, uzun yazım veya düşük maliyet gibi özel hedefleriniz varsa modelleri kendi prompt setinizle kıyaslayın.

Ne alırsınız, ne alamayabilirsiniz?

Aldıklarınız

  • Gemini 2.5 / 2.0 / 3 Flash ailesi
  • Gemini 2.5 Pro
  • Gemma 2 / 3 / 4 ailesi
  • Çok turlu sohbet
  • Akış yanıtları
  • Görüntü URL'si ile görsel giriş
  • temperature, max_tokens, sistem istemleri gibi standart ayarlar
  • Tarayıcı tabanlı üretim kullanımı

Puter sürümüne bağlı olarak alamayabilecekleriniz

  • Gemini yerel function calling desteğinin tamamı
  • Kod yürütme aracı
  • Google Arama grounding
  • Gemini'nin tam 2M token bağlam penceresi
  • Kullanıcı oturumu olmadan sunucu tarafı kullanım
  • Google tarafındaki hız sınırlarını doğrudan görme

Kod yürütme, grounding, uzun bağlam veya backend servis gerektiren ajan akışlarında resmi Google AI Studio API'si daha uygun olabilir. Tarayıcı tabanlı sohbet, Soru-Cevap, içerik üretimi ve görsel analiz için Puter yeterli olabilir.

Puter mı, resmi Gemini API'si mi?

Puter'ı şu durumlarda kullanın

  • Ücretsiz bir genel uygulama yayınlıyorsunuz.
  • Faturalandırma riski almak istemiyorsunuz.
  • Google Cloud projesi kurmadan prototip geliştirmek istiyorsunuz.
  • Statik site, hackathon projesi veya tarayıcı uzantısı geliştiriyorsunuz.
  • Kullanıcılarınız Puter giriş adımını kabul edebilir.

Resmi Gemini API'sini şu durumlarda kullanın

  • Sunucu tarafı çağrılara ihtiyacınız var.
  • Zamanlanmış görev, batch işlem veya webhook çalıştırıyorsunuz.
  • Kod yürütme veya Google Arama grounding gerekiyor.
  • Tam uzun bağlam penceresine ihtiyacınız var.
  • Google ile doğrudan sözleşmeli ilişki veya uyumluluk gereksiniminiz var.
  • Kullanıcılarınız üçüncü taraf giriş adımı istemiyor.

Gemini 3 Flash için ayrı bir rehber arıyorsanız Gemini 3 Flash Önizleme API'si nasıl kullanılır yazısına bakabilirsiniz.

Apidog ile entegrasyonu test edin

Puter çağrıları tarayıcıda gerçekleşir. Bu nedenle doğrudan klasik backend API test runner akışıyla birebir aynı şekilde çalışmaz. Daha pratik yaklaşım:

  1. Puter.js içeren küçük bir statik test sayfası oluşturun.
  2. Prompt'u query parametresi olarak alın.
  3. Aynı kullanım senaryosu için resmi Gemini API isteğini Apidog'da modelleyin.
  4. Puter prototipi ile Gemini prod ortamını ayrı environment olarak tutun.

Örnek ortam yapısı:

puter-prototype
BASE_URL=http://localhost:5173
Enter fullscreen mode Exit fullscreen mode
gemini-prod
BASE_URL=https://generativelanguage.googleapis.com/v1
Enter fullscreen mode Exit fullscreen mode

Apidog'u indirin ve iki ortam oluşturun:

  • puter-prototype: Puter sayfanızın çalıştığı localhost URL'si
  • gemini-prod: resmi Gemini API taban URL'si

Böylece prototipten resmi API'ye geçerken istek yapısını, prompt'ları ve test senaryolarını düzenli tutabilirsiniz. Daha geniş API test pratikleri için QA mühendisleri için API test aracı yazısına da bakabilirsiniz.

Puter ile diğer LLM yolları

Aynı kullanıcı ödeme modeli farklı LLM sağlayıcıları için de kullanılabilir:

Temel entegrasyon aynı kalır. Sadece model değerini değiştirirsiniz:

const response = await puter.ai.chat("Kısa bir API dokümantasyonu taslağı yaz.", {
  model: "google/gemini-2.5-flash",
});
Enter fullscreen mode Exit fullscreen mode

Başka bir sağlayıcıya geçmek için:

const response = await puter.ai.chat("Kısa bir API dokümantasyonu taslağı yaz.", {
  model: "claude-sonnet-4-6",
});
Enter fullscreen mode Exit fullscreen mode

SSS

Bu gerçekten sınırsız mı?

Geliştirici tarafında Google API faturası veya sabit kullanım limiti yoktur. Kullanım, son kullanıcının Puter hesabındaki bakiye ve Puter kullanım koşullarıyla ilişkilidir. Yeni hesaplar başlangıç kredisi alır; daha fazla kullanım isteyen kullanıcılar bakiye yükleyebilir.

Google hesabına veya Google Cloud projesine ihtiyacım var mı?

Hayır. Puter, Google tarafındaki ilişkiyi yönetir. Uygulamanızda Google API anahtarı tutmazsınız.

Bunu üretimde kullanabilir miyim?

Tarayıcı tabanlı uygulamalar için evet. Asıl karar noktası, kullanıcılarınızın Puter hesabıyla giriş yapma adımını kabul edip etmeyeceğidir.

Puter üzerinden Gemini, resmi API ile aynı çıktıyı mı üretir?

Puter, kullanıcı adına modeli çağırır. Model davranışı aynı model ailesine dayanır. Ancak ek bir katman olduğu için gecikme resmi API'ye göre farklı olabilir.

Gemini'nin 2M token bağlam penceresi ne olacak?

Puter her model varyantında tam 2M bağlam tavanını sunmayabilir. Çok uzun bağlam gerektiren işlerde resmi Google AI Studio API'si daha doğru seçimdir.

Discord botu veya backend servisi için kullanabilir miyim?

Temiz bir çözüm olarak hayır. Puter tarayıcı önceliklidir ve kullanıcı oturumu varsayar. Backend servisleri için resmi Gemini API'si kullanılmalıdır.

Varsayılan olarak hangi modeli seçmeliyim?

Çoğu kullanım için:

google/gemini-2.5-flash
Enter fullscreen mode Exit fullscreen mode

Zor akıl yürütme için:

google/gemini-2.5-pro
Enter fullscreen mode Exit fullscreen mode

Yüksek hacimli sınıflandırma için:

google/gemini-2.5-flash-lite
Enter fullscreen mode Exit fullscreen mode

Görüntü oluşturma destekleniyor mu?

Puter bugün görüntü oluşturmayı Imagen üzerinden değil, OpenAI'nin gpt-image-2 ve DALL-E varyantları üzerinden sunar. Görüntü oluşturma yolu için Ücretsiz sınırsız GPT-5.5 API edinin yazısına bakabilirsiniz.

Sonuç

Puter.js, Google Cloud kurulumu yapmadan Gemini modellerini tarayıcı tabanlı uygulamalara eklemek için pratik bir yoldur. En hızlı başlangıç akışı:

  1. Sayfaya Puter.js script'ini ekleyin.
  2. google/gemini-2.5-flash ile başlayın.
  3. Prompt'u gönderin.
  4. Gerekirse streaming, görüntü girişi ve çok turlu sohbet ekleyin.
  5. Üretim gereksinimleriniz backend, uzun bağlam veya özel Google özellikleri gerektiriyorsa resmi Gemini API'sine geçin.

Sunucu tarafı Gemini, ince ayar, kod yürütme veya tam uzun bağlam gerekiyorsa resmi Google AI Studio API'si daha uygundur. Prototipler, hackathon projeleri, statik siteler ve ücretsiz genel uygulamalar için Puter daha düşük operasyonel yükle başlamanızı sağlar.

Apidog üzerinde resmi API isteğini modelleyin, Puter prototipinizle karşılaştırın ve uygulamanız için doğru yolu seçin.

Top comments (0)