Tobias Hoffmann

Posted on May 9 • Originally published at apidog.com

Ücretsiz Sınırsız Gemini API Erişimi

Google'ın Gemini ailesi, yüksek hacimli iş yükleri için en uygun maliyetli sınır model serilerinden biridir. Gemini 2.5 Pro milyon token başına 1,25 / 10 dolar maliyetle çalışır; Flash varyantları daha ucuzdur. Ancak ücretsiz bir genel uygulama, yan proje veya hackathon prototipi birkaç bin kullanıcıya ulaştığında bu maliyet hızla büyür. Puter.js farklı bir model sunar: Gemini serisini ve açık Gemma modellerini Google API anahtarı olmadan tarayıcıdan kullanırsınız; kullanım maliyeti geliştirici yerine son kullanıcının Puter hesabına yansır.

Apidog'u bugün deneyin

TL;DR

Puter.js, Gemini ve Gemma modellerine Google API anahtarı, Google Cloud projesi ve sunucu olmadan erişmenizi sağlar.
Desteklenen Gemini modelleri: 2.5 Pro, 2.5 Flash, 2.5 Flash Lite, 2.0 Flash, 2.0 Flash Lite, 3 Flash Önizlemesi ve bazı eski önizlemeler.
Desteklenen Gemma modelleri: farklı boyutlarda Gemma 2, 3 ve 4.
Kurulum tek bir <script> etiketiyle yapılır.
Akış, görüntü girişi, sıcaklık ayarı ve çok turlu sohbetler tarayıcıda çalışır.
Son kullanıcı Puter hesabı üzerinden kendi kullanımını karşılar; geliştirici tarafında Google faturası oluşmaz.
Puter prototipinizi resmi Gemini API'sine taşımayı planlıyorsanız, karşılaştırmalı testler için Apidog kullanabilirsiniz.

“Ücretsiz sınırsız” model nasıl çalışır?

Puter.js, LLM faturalandırma akışını tersine çevirir. Normalde geliştirici bir Google AI Studio anahtarı tutar ve tüm token maliyetini kendisi öder. Puter'da ise kullanıcı Puter hesabıyla giriş yapar ve çağrı onun bakiyesinden karşılanır.

Geliştirici açısından sonuç:

Google Cloud projesi gerekmez.
AI Studio API anahtarı tutmazsınız.
Sunucu veya proxy yazmanız gerekmez.
Kullanım maliyeti sizin hesabınıza yazılmaz.
Ölçek, kullanıcıların kendi Puter kullanımına bağlıdır.

Takas noktası şudur: Puter.js tarayıcı önceliklidir. Zamanlanmış arka uç işleri, batch görevleri veya kullanıcı oturumu olmayan servisler için doğrudan resmi Gemini API'si daha uygundur.

Adım 1: Puter.js'i yükleyin

Statik bir sayfada tek CDN etiketi yeterlidir:

<script src="https://js.puter.com/v2/"></script>

Tam bir HTML örneği:

<!DOCTYPE html>
<html lang="tr">
<body>
  <script src="https://js.puter.com/v2/"></script>
</body>
</html>

Paketlenmiş bir uygulamada kullanmak isterseniz:

npm install @heyputer/puter.js

import { puter } from '@heyputer/puter.js';

Adım 2: Model seçin

Puter üzerinden kullanabileceğiniz temel Gemini/Gemma seçenekleri:

Model Kimliği	Ne zaman kullanılır?
`google/gemini-2.5-pro`	Karmaşık akıl yürütme, uzun analizler, zor karar görevleri
`google/gemini-2.5-flash`	Genel amaçlı sohbet, Soru-Cevap, içerik üretimi
`google/gemini-2.5-flash-lite`	Yüksek hacimli sınıflandırma, etiketleme, kısa yanıtlar
`google/gemini-2.0-flash`	Stabil davranış isteyen üretim senaryoları
`google/gemini-3-flash-preview`	En yeni önizleme özelliklerini denemek
`google/gemma-3-27b-it`	Açık Gemma tabanlı talimat odaklı iş akışları
`google/gemma-4-31b-it`	Daha büyük açık Gemma modeliyle kalite denemeleri

Pratik varsayılan:

google/gemini-2.5-flash

Çoğu uygulamada önce Flash ile başlayın. Yalnızca zor akıl yürütme, kapsamlı analiz veya karmaşık planlama gereken yerlerde Pro'ya geçin. Lite modelleri ise sınıflandırma, etiketleme ve basit Soru-Cevap için daha uygundur.

Adım 3: İlk Gemini çağrısını yapın

Minimum çalışan örnek:

<!DOCTYPE html>
<html lang="tr">
<body>
  <script src="https://js.puter.com/v2/"></script>

  <script>
    puter.ai.chat(
      "Makine öğrenmesini üç cümlede açıklayın.",
      { model: "google/gemini-2.5-flash" }
    ).then(response => {
      puter.print(response);
    });
  </script>
</body>
</html>

Bu dosyayı tarayıcıda açtığınızda:

Puter.js yüklenir.
Kullanıcı gerekirse Puter hesabıyla giriş yapar.
Gemini çağrısı yapılır.
Yanıt sayfaya yazdırılır.

API anahtarı, .env dosyası veya backend gerekmez.

Adım 4: Yanıtı akış olarak alın

Chat UI geliştiriyorsanız yanıtı tek parça beklemek yerine akışla göstermek daha iyi kullanıcı deneyimi sağlar.

const response = await puter.ai.chat(
  "Fotosentezi ayrıntılı olarak açıklayın.",
  {
    model: "google/gemini-2.5-flash",
    stream: true,
  }
);

for await (const part of response) {
  if (part?.text) {
    outputDiv.innerHTML += part.text;
  }
}

Basit bir HTML entegrasyonu:

<div id="output"></div>

<script src="https://js.puter.com/v2/"></script>
<script>
  const outputDiv = document.getElementById("output");

  async function run() {
    const response = await puter.ai.chat(
      "REST API nedir? Kısa ama teknik anlat.",
      {
        model: "google/gemini-2.5-flash",
        stream: true,
      }
    );

    for await (const part of response) {
      if (part?.text) {
        outputDiv.innerHTML += part.text;
      }
    }
  }

  run();
</script>

Her part.text, yanıtın bir parçasıdır. UI'a ekledikçe kullanıcı yanıtın canlı yazıldığını görür.

Adım 5: Görüntü girişi kullanın

Gemini'nin güçlü taraflarından biri çok modlu giriş desteğidir. Puter ile modele bir görüntü URL'si verebilirsiniz:

puter.ai.chat(
  "Bu resimde ne görüyorsunuz? Renkleri, nesneleri ve genel ruh halini açıklayın.",
  "https://assets.puter.site/doge.jpeg",
  { model: "google/gemini-2.5-flash" }
).then(response => {
  puter.print(response);
});

Kullanım alanları:

Alt metin üretimi
Görsel Soru-Cevap
Ekran görüntüsü analizi
OCR benzeri iş akışları
Erişilebilirlik araçları
Ürün görseli etiketleme
Diyagram açıklama

Doğal görüntüler ve diyagramlar için Gemini güçlü sonuç verir. Yoğun metin içeren ekran görüntülerinde bazı modeller belirli senaryolarda daha iyi performans gösterebilir; bu nedenle kendi veri tipinizle test etmek önemlidir.

Adım 6: Sıcaklık değerini ayarlayın

temperature, modelin ne kadar deterministik veya yaratıcı davranacağını etkiler.

const response = await puter.ai.chat(
  "Robot bir şef hakkında yaratıcı bir kısa hikaye yaz.",
  {
    model: "google/gemini-2.5-flash",
    temperature: 0.8,
  }
);

console.log(response);

Pratik aralıklar:

0.0–0.3: gerçek odaklı, yapılandırılmış, tekrarlanabilir yanıtlar
0.4–0.7: genel sohbet ve içerik üretimi
0.7–1.0: yaratıcı yazım, fikir üretimi, varyasyon denemeleri

Örneğin JSON üretmesini istiyorsanız düşük sıcaklık kullanın:

const response = await puter.ai.chat(
  `Aşağıdaki metni duygu analizine tabi tut ve sadece JSON döndür:
  "Ürün hızlı geldi ama paketleme kötüydü."`,
  {
    model: "google/gemini-2.5-flash",
    temperature: 0.2,
  }
);

Adım 7: Çok turlu sohbet kurun

Önceki mesajları bir dizi olarak iletin:

const messages = [
  { role: "user", content: "Next.js uygulaması ve Postgres kullanıyorum." },
  { role: "assistant", content: "Anladım. Ne konuda yardıma ihtiyacın var?" },
  { role: "user", content: "Migrationları nasıl yapılandırmalıyım?" },
];

const response = await puter.ai.chat(messages, {
  model: "google/gemini-2.5-pro",
});

console.log(response);

Bir sohbet arayüzünde her turdan sonra geçmişi güncelleyin:

const messages = [];

async function sendMessage(userInput) {
  messages.push({
    role: "user",
    content: userInput,
  });

  const response = await puter.ai.chat(messages, {
    model: "google/gemini-2.5-flash",
  });

  messages.push({
    role: "assistant",
    content: response,
  });

  return response;
}

Bu yapı sayesinde Gemini önceki konuşmayı okuyarak bağlamı korur.

Aynı prompt ile modelleri karşılaştırın

Puter, farklı sağlayıcı modellerini tek arayüzden çağırabildiği için aynı prompt'u birden fazla modelde test edebilirsiniz:

const models = [
  "google/gemini-2.5-flash",
  "claude-sonnet-4-6",
  "gpt-5.5",
  "x-ai/grok-4.3",
];

const prompt = "Bu React bileşenini hooks kullanacak şekilde yeniden düzenle: ...";

for (const model of models) {
  const start = performance.now();

  const response = await puter.ai.chat(prompt, { model });

  const elapsed = performance.now() - start;

  console.log(`${model}: ${elapsed.toFixed(0)}ms`);
  console.log(response);
  console.log("---");
}

Bu yaklaşım özellikle şunlar için işe yarar:

Kod üretimi kalitesini karşılaştırma
Gecikme ölçümü
Uzun yanıt kalitesi
Basit sınıflandırma doğruluğu
Farklı modellerin aynı veri üzerindeki davranışını görme

Genel pratik: Gemini Flash çoğu durumda hız ve kalite dengesi için iyi bir başlangıçtır. Kodlama, uzun yazım veya düşük maliyet gibi özel hedefleriniz varsa modelleri kendi prompt setinizle kıyaslayın.

Ne alırsınız, ne alamayabilirsiniz?

Aldıklarınız

Gemini 2.5 / 2.0 / 3 Flash ailesi
Gemini 2.5 Pro
Gemma 2 / 3 / 4 ailesi
Çok turlu sohbet
Akış yanıtları
Görüntü URL'si ile görsel giriş
temperature, max_tokens, sistem istemleri gibi standart ayarlar
Tarayıcı tabanlı üretim kullanımı

Puter sürümüne bağlı olarak alamayabilecekleriniz

Gemini yerel function calling desteğinin tamamı
Kod yürütme aracı
Google Arama grounding
Gemini'nin tam 2M token bağlam penceresi
Kullanıcı oturumu olmadan sunucu tarafı kullanım
Google tarafındaki hız sınırlarını doğrudan görme

Kod yürütme, grounding, uzun bağlam veya backend servis gerektiren ajan akışlarında resmi Google AI Studio API'si daha uygun olabilir. Tarayıcı tabanlı sohbet, Soru-Cevap, içerik üretimi ve görsel analiz için Puter yeterli olabilir.

Puter mı, resmi Gemini API'si mi?

Puter'ı şu durumlarda kullanın

Ücretsiz bir genel uygulama yayınlıyorsunuz.
Faturalandırma riski almak istemiyorsunuz.
Google Cloud projesi kurmadan prototip geliştirmek istiyorsunuz.
Statik site, hackathon projesi veya tarayıcı uzantısı geliştiriyorsunuz.
Kullanıcılarınız Puter giriş adımını kabul edebilir.

Resmi Gemini API'sini şu durumlarda kullanın

Sunucu tarafı çağrılara ihtiyacınız var.
Zamanlanmış görev, batch işlem veya webhook çalıştırıyorsunuz.
Kod yürütme veya Google Arama grounding gerekiyor.
Tam uzun bağlam penceresine ihtiyacınız var.
Google ile doğrudan sözleşmeli ilişki veya uyumluluk gereksiniminiz var.
Kullanıcılarınız üçüncü taraf giriş adımı istemiyor.

Gemini 3 Flash için ayrı bir rehber arıyorsanız Gemini 3 Flash Önizleme API'si nasıl kullanılır yazısına bakabilirsiniz.

Apidog ile entegrasyonu test edin

Puter çağrıları tarayıcıda gerçekleşir. Bu nedenle doğrudan klasik backend API test runner akışıyla birebir aynı şekilde çalışmaz. Daha pratik yaklaşım:

Puter.js içeren küçük bir statik test sayfası oluşturun.
Prompt'u query parametresi olarak alın.
Aynı kullanım senaryosu için resmi Gemini API isteğini Apidog'da modelleyin.
Puter prototipi ile Gemini prod ortamını ayrı environment olarak tutun.

Örnek ortam yapısı:

puter-prototype
BASE_URL=http://localhost:5173

gemini-prod
BASE_URL=https://generativelanguage.googleapis.com/v1

Apidog'u indirin ve iki ortam oluşturun:

puter-prototype: Puter sayfanızın çalıştığı localhost URL'si
gemini-prod: resmi Gemini API taban URL'si

Böylece prototipten resmi API'ye geçerken istek yapısını, prompt'ları ve test senaryolarını düzenli tutabilirsiniz. Daha geniş API test pratikleri için QA mühendisleri için API test aracı yazısına da bakabilirsiniz.

Puter ile diğer LLM yolları

Aynı kullanıcı ödeme modeli farklı LLM sağlayıcıları için de kullanılabilir:

Temel entegrasyon aynı kalır. Sadece model değerini değiştirirsiniz:

const response = await puter.ai.chat("Kısa bir API dokümantasyonu taslağı yaz.", {
  model: "google/gemini-2.5-flash",
});

Başka bir sağlayıcıya geçmek için:

const response = await puter.ai.chat("Kısa bir API dokümantasyonu taslağı yaz.", {
  model: "claude-sonnet-4-6",
});

SSS

Bu gerçekten sınırsız mı?

Geliştirici tarafında Google API faturası veya sabit kullanım limiti yoktur. Kullanım, son kullanıcının Puter hesabındaki bakiye ve Puter kullanım koşullarıyla ilişkilidir. Yeni hesaplar başlangıç kredisi alır; daha fazla kullanım isteyen kullanıcılar bakiye yükleyebilir.

Google hesabına veya Google Cloud projesine ihtiyacım var mı?

Hayır. Puter, Google tarafındaki ilişkiyi yönetir. Uygulamanızda Google API anahtarı tutmazsınız.

Bunu üretimde kullanabilir miyim?

Tarayıcı tabanlı uygulamalar için evet. Asıl karar noktası, kullanıcılarınızın Puter hesabıyla giriş yapma adımını kabul edip etmeyeceğidir.

Puter üzerinden Gemini, resmi API ile aynı çıktıyı mı üretir?

Puter, kullanıcı adına modeli çağırır. Model davranışı aynı model ailesine dayanır. Ancak ek bir katman olduğu için gecikme resmi API'ye göre farklı olabilir.

Gemini'nin 2M token bağlam penceresi ne olacak?

Puter her model varyantında tam 2M bağlam tavanını sunmayabilir. Çok uzun bağlam gerektiren işlerde resmi Google AI Studio API'si daha doğru seçimdir.

Discord botu veya backend servisi için kullanabilir miyim?

Temiz bir çözüm olarak hayır. Puter tarayıcı önceliklidir ve kullanıcı oturumu varsayar. Backend servisleri için resmi Gemini API'si kullanılmalıdır.

Varsayılan olarak hangi modeli seçmeliyim?

Çoğu kullanım için:

google/gemini-2.5-flash

Zor akıl yürütme için:

google/gemini-2.5-pro

Yüksek hacimli sınıflandırma için:

google/gemini-2.5-flash-lite

Görüntü oluşturma destekleniyor mu?

Puter bugün görüntü oluşturmayı Imagen üzerinden değil, OpenAI'nin gpt-image-2 ve DALL-E varyantları üzerinden sunar. Görüntü oluşturma yolu için Ücretsiz sınırsız GPT-5.5 API edinin yazısına bakabilirsiniz.

Sonuç

Puter.js, Google Cloud kurulumu yapmadan Gemini modellerini tarayıcı tabanlı uygulamalara eklemek için pratik bir yoldur. En hızlı başlangıç akışı:

Sayfaya Puter.js script'ini ekleyin.
google/gemini-2.5-flash ile başlayın.
Prompt'u gönderin.
Gerekirse streaming, görüntü girişi ve çok turlu sohbet ekleyin.
Üretim gereksinimleriniz backend, uzun bağlam veya özel Google özellikleri gerektiriyorsa resmi Gemini API'sine geçin.

Sunucu tarafı Gemini, ince ayar, kod yürütme veya tam uzun bağlam gerekiyorsa resmi Google AI Studio API'si daha uygundur. Prototipler, hackathon projeleri, statik siteler ve ücretsiz genel uygulamalar için Puter daha düşük operasyonel yükle başlamanızı sağlar.

Apidog üzerinde resmi API isteğini modelleyin, Puter prototipinizle karşılaştırın ve uygulamanız için doğru yolu seçin.

DEV Community