Google'ın Gemini ailesi, yüksek hacimli iş yükleri için en uygun maliyetli sınır model serilerinden biridir. Gemini 2.5 Pro milyon token başına 1,25 / 10 dolar maliyetle çalışır; Flash varyantları daha ucuzdur. Ancak ücretsiz bir genel uygulama, yan proje veya hackathon prototipi birkaç bin kullanıcıya ulaştığında bu maliyet hızla büyür. Puter.js farklı bir model sunar: Gemini serisini ve açık Gemma modellerini Google API anahtarı olmadan tarayıcıdan kullanırsınız; kullanım maliyeti geliştirici yerine son kullanıcının Puter hesabına yansır.
TL;DR
- Puter.js, Gemini ve Gemma modellerine Google API anahtarı, Google Cloud projesi ve sunucu olmadan erişmenizi sağlar.
- Desteklenen Gemini modelleri: 2.5 Pro, 2.5 Flash, 2.5 Flash Lite, 2.0 Flash, 2.0 Flash Lite, 3 Flash Önizlemesi ve bazı eski önizlemeler.
- Desteklenen Gemma modelleri: farklı boyutlarda Gemma 2, 3 ve 4.
- Kurulum tek bir
<script>etiketiyle yapılır. - Akış, görüntü girişi, sıcaklık ayarı ve çok turlu sohbetler tarayıcıda çalışır.
- Son kullanıcı Puter hesabı üzerinden kendi kullanımını karşılar; geliştirici tarafında Google faturası oluşmaz.
- Puter prototipinizi resmi Gemini API'sine taşımayı planlıyorsanız, karşılaştırmalı testler için Apidog kullanabilirsiniz.
“Ücretsiz sınırsız” model nasıl çalışır?
Puter.js, LLM faturalandırma akışını tersine çevirir. Normalde geliştirici bir Google AI Studio anahtarı tutar ve tüm token maliyetini kendisi öder. Puter'da ise kullanıcı Puter hesabıyla giriş yapar ve çağrı onun bakiyesinden karşılanır.
Geliştirici açısından sonuç:
- Google Cloud projesi gerekmez.
- AI Studio API anahtarı tutmazsınız.
- Sunucu veya proxy yazmanız gerekmez.
- Kullanım maliyeti sizin hesabınıza yazılmaz.
- Ölçek, kullanıcıların kendi Puter kullanımına bağlıdır.
Takas noktası şudur: Puter.js tarayıcı önceliklidir. Zamanlanmış arka uç işleri, batch görevleri veya kullanıcı oturumu olmayan servisler için doğrudan resmi Gemini API'si daha uygundur.
Adım 1: Puter.js'i yükleyin
Statik bir sayfada tek CDN etiketi yeterlidir:
<script src="https://js.puter.com/v2/"></script>
Tam bir HTML örneği:
<!DOCTYPE html>
<html lang="tr">
<body>
<script src="https://js.puter.com/v2/"></script>
</body>
</html>
Paketlenmiş bir uygulamada kullanmak isterseniz:
npm install @heyputer/puter.js
import { puter } from '@heyputer/puter.js';
Adım 2: Model seçin
Puter üzerinden kullanabileceğiniz temel Gemini/Gemma seçenekleri:
| Model Kimliği | Ne zaman kullanılır? |
|---|---|
google/gemini-2.5-pro |
Karmaşık akıl yürütme, uzun analizler, zor karar görevleri |
google/gemini-2.5-flash |
Genel amaçlı sohbet, Soru-Cevap, içerik üretimi |
google/gemini-2.5-flash-lite |
Yüksek hacimli sınıflandırma, etiketleme, kısa yanıtlar |
google/gemini-2.0-flash |
Stabil davranış isteyen üretim senaryoları |
google/gemini-3-flash-preview |
En yeni önizleme özelliklerini denemek |
google/gemma-3-27b-it |
Açık Gemma tabanlı talimat odaklı iş akışları |
google/gemma-4-31b-it |
Daha büyük açık Gemma modeliyle kalite denemeleri |
Pratik varsayılan:
google/gemini-2.5-flash
Çoğu uygulamada önce Flash ile başlayın. Yalnızca zor akıl yürütme, kapsamlı analiz veya karmaşık planlama gereken yerlerde Pro'ya geçin. Lite modelleri ise sınıflandırma, etiketleme ve basit Soru-Cevap için daha uygundur.
Adım 3: İlk Gemini çağrısını yapın
Minimum çalışan örnek:
<!DOCTYPE html>
<html lang="tr">
<body>
<script src="https://js.puter.com/v2/"></script>
<script>
puter.ai.chat(
"Makine öğrenmesini üç cümlede açıklayın.",
{ model: "google/gemini-2.5-flash" }
).then(response => {
puter.print(response);
});
</script>
</body>
</html>
Bu dosyayı tarayıcıda açtığınızda:
- Puter.js yüklenir.
- Kullanıcı gerekirse Puter hesabıyla giriş yapar.
- Gemini çağrısı yapılır.
- Yanıt sayfaya yazdırılır.
API anahtarı, .env dosyası veya backend gerekmez.
Adım 4: Yanıtı akış olarak alın
Chat UI geliştiriyorsanız yanıtı tek parça beklemek yerine akışla göstermek daha iyi kullanıcı deneyimi sağlar.
const response = await puter.ai.chat(
"Fotosentezi ayrıntılı olarak açıklayın.",
{
model: "google/gemini-2.5-flash",
stream: true,
}
);
for await (const part of response) {
if (part?.text) {
outputDiv.innerHTML += part.text;
}
}
Basit bir HTML entegrasyonu:
<div id="output"></div>
<script src="https://js.puter.com/v2/"></script>
<script>
const outputDiv = document.getElementById("output");
async function run() {
const response = await puter.ai.chat(
"REST API nedir? Kısa ama teknik anlat.",
{
model: "google/gemini-2.5-flash",
stream: true,
}
);
for await (const part of response) {
if (part?.text) {
outputDiv.innerHTML += part.text;
}
}
}
run();
</script>
Her part.text, yanıtın bir parçasıdır. UI'a ekledikçe kullanıcı yanıtın canlı yazıldığını görür.
Adım 5: Görüntü girişi kullanın
Gemini'nin güçlü taraflarından biri çok modlu giriş desteğidir. Puter ile modele bir görüntü URL'si verebilirsiniz:
puter.ai.chat(
"Bu resimde ne görüyorsunuz? Renkleri, nesneleri ve genel ruh halini açıklayın.",
"https://assets.puter.site/doge.jpeg",
{ model: "google/gemini-2.5-flash" }
).then(response => {
puter.print(response);
});
Kullanım alanları:
- Alt metin üretimi
- Görsel Soru-Cevap
- Ekran görüntüsü analizi
- OCR benzeri iş akışları
- Erişilebilirlik araçları
- Ürün görseli etiketleme
- Diyagram açıklama
Doğal görüntüler ve diyagramlar için Gemini güçlü sonuç verir. Yoğun metin içeren ekran görüntülerinde bazı modeller belirli senaryolarda daha iyi performans gösterebilir; bu nedenle kendi veri tipinizle test etmek önemlidir.
Adım 6: Sıcaklık değerini ayarlayın
temperature, modelin ne kadar deterministik veya yaratıcı davranacağını etkiler.
const response = await puter.ai.chat(
"Robot bir şef hakkında yaratıcı bir kısa hikaye yaz.",
{
model: "google/gemini-2.5-flash",
temperature: 0.8,
}
);
console.log(response);
Pratik aralıklar:
-
0.0–0.3: gerçek odaklı, yapılandırılmış, tekrarlanabilir yanıtlar -
0.4–0.7: genel sohbet ve içerik üretimi -
0.7–1.0: yaratıcı yazım, fikir üretimi, varyasyon denemeleri
Örneğin JSON üretmesini istiyorsanız düşük sıcaklık kullanın:
const response = await puter.ai.chat(
`Aşağıdaki metni duygu analizine tabi tut ve sadece JSON döndür:
"Ürün hızlı geldi ama paketleme kötüydü."`,
{
model: "google/gemini-2.5-flash",
temperature: 0.2,
}
);
Adım 7: Çok turlu sohbet kurun
Önceki mesajları bir dizi olarak iletin:
const messages = [
{ role: "user", content: "Next.js uygulaması ve Postgres kullanıyorum." },
{ role: "assistant", content: "Anladım. Ne konuda yardıma ihtiyacın var?" },
{ role: "user", content: "Migrationları nasıl yapılandırmalıyım?" },
];
const response = await puter.ai.chat(messages, {
model: "google/gemini-2.5-pro",
});
console.log(response);
Bir sohbet arayüzünde her turdan sonra geçmişi güncelleyin:
const messages = [];
async function sendMessage(userInput) {
messages.push({
role: "user",
content: userInput,
});
const response = await puter.ai.chat(messages, {
model: "google/gemini-2.5-flash",
});
messages.push({
role: "assistant",
content: response,
});
return response;
}
Bu yapı sayesinde Gemini önceki konuşmayı okuyarak bağlamı korur.
Aynı prompt ile modelleri karşılaştırın
Puter, farklı sağlayıcı modellerini tek arayüzden çağırabildiği için aynı prompt'u birden fazla modelde test edebilirsiniz:
const models = [
"google/gemini-2.5-flash",
"claude-sonnet-4-6",
"gpt-5.5",
"x-ai/grok-4.3",
];
const prompt = "Bu React bileşenini hooks kullanacak şekilde yeniden düzenle: ...";
for (const model of models) {
const start = performance.now();
const response = await puter.ai.chat(prompt, { model });
const elapsed = performance.now() - start;
console.log(`${model}: ${elapsed.toFixed(0)}ms`);
console.log(response);
console.log("---");
}
Bu yaklaşım özellikle şunlar için işe yarar:
- Kod üretimi kalitesini karşılaştırma
- Gecikme ölçümü
- Uzun yanıt kalitesi
- Basit sınıflandırma doğruluğu
- Farklı modellerin aynı veri üzerindeki davranışını görme
Genel pratik: Gemini Flash çoğu durumda hız ve kalite dengesi için iyi bir başlangıçtır. Kodlama, uzun yazım veya düşük maliyet gibi özel hedefleriniz varsa modelleri kendi prompt setinizle kıyaslayın.
Ne alırsınız, ne alamayabilirsiniz?
Aldıklarınız
- Gemini 2.5 / 2.0 / 3 Flash ailesi
- Gemini 2.5 Pro
- Gemma 2 / 3 / 4 ailesi
- Çok turlu sohbet
- Akış yanıtları
- Görüntü URL'si ile görsel giriş
-
temperature,max_tokens, sistem istemleri gibi standart ayarlar - Tarayıcı tabanlı üretim kullanımı
Puter sürümüne bağlı olarak alamayabilecekleriniz
- Gemini yerel function calling desteğinin tamamı
- Kod yürütme aracı
- Google Arama grounding
- Gemini'nin tam 2M token bağlam penceresi
- Kullanıcı oturumu olmadan sunucu tarafı kullanım
- Google tarafındaki hız sınırlarını doğrudan görme
Kod yürütme, grounding, uzun bağlam veya backend servis gerektiren ajan akışlarında resmi Google AI Studio API'si daha uygun olabilir. Tarayıcı tabanlı sohbet, Soru-Cevap, içerik üretimi ve görsel analiz için Puter yeterli olabilir.
Puter mı, resmi Gemini API'si mi?
Puter'ı şu durumlarda kullanın
- Ücretsiz bir genel uygulama yayınlıyorsunuz.
- Faturalandırma riski almak istemiyorsunuz.
- Google Cloud projesi kurmadan prototip geliştirmek istiyorsunuz.
- Statik site, hackathon projesi veya tarayıcı uzantısı geliştiriyorsunuz.
- Kullanıcılarınız Puter giriş adımını kabul edebilir.
Resmi Gemini API'sini şu durumlarda kullanın
- Sunucu tarafı çağrılara ihtiyacınız var.
- Zamanlanmış görev, batch işlem veya webhook çalıştırıyorsunuz.
- Kod yürütme veya Google Arama grounding gerekiyor.
- Tam uzun bağlam penceresine ihtiyacınız var.
- Google ile doğrudan sözleşmeli ilişki veya uyumluluk gereksiniminiz var.
- Kullanıcılarınız üçüncü taraf giriş adımı istemiyor.
Gemini 3 Flash için ayrı bir rehber arıyorsanız Gemini 3 Flash Önizleme API'si nasıl kullanılır yazısına bakabilirsiniz.
Apidog ile entegrasyonu test edin
Puter çağrıları tarayıcıda gerçekleşir. Bu nedenle doğrudan klasik backend API test runner akışıyla birebir aynı şekilde çalışmaz. Daha pratik yaklaşım:
- Puter.js içeren küçük bir statik test sayfası oluşturun.
- Prompt'u query parametresi olarak alın.
- Aynı kullanım senaryosu için resmi Gemini API isteğini Apidog'da modelleyin.
- Puter prototipi ile Gemini prod ortamını ayrı environment olarak tutun.
Örnek ortam yapısı:
puter-prototype
BASE_URL=http://localhost:5173
gemini-prod
BASE_URL=https://generativelanguage.googleapis.com/v1
Apidog'u indirin ve iki ortam oluşturun:
-
puter-prototype: Puter sayfanızın çalıştığı localhost URL'si -
gemini-prod: resmi Gemini API taban URL'si
Böylece prototipten resmi API'ye geçerken istek yapısını, prompt'ları ve test senaryolarını düzenli tutabilirsiniz. Daha geniş API test pratikleri için QA mühendisleri için API test aracı yazısına da bakabilirsiniz.
Puter ile diğer LLM yolları
Aynı kullanıcı ödeme modeli farklı LLM sağlayıcıları için de kullanılabilir:
- Ücretsiz sınırsız Claude API edinin
- Ücretsiz sınırsız GPT-5.5 API edinin
- Grok 4.3 nasıl ücretsiz kullanılır
- Ücretsiz sınırsız DeepSeek API edinin
Temel entegrasyon aynı kalır. Sadece model değerini değiştirirsiniz:
const response = await puter.ai.chat("Kısa bir API dokümantasyonu taslağı yaz.", {
model: "google/gemini-2.5-flash",
});
Başka bir sağlayıcıya geçmek için:
const response = await puter.ai.chat("Kısa bir API dokümantasyonu taslağı yaz.", {
model: "claude-sonnet-4-6",
});
SSS
Bu gerçekten sınırsız mı?
Geliştirici tarafında Google API faturası veya sabit kullanım limiti yoktur. Kullanım, son kullanıcının Puter hesabındaki bakiye ve Puter kullanım koşullarıyla ilişkilidir. Yeni hesaplar başlangıç kredisi alır; daha fazla kullanım isteyen kullanıcılar bakiye yükleyebilir.
Google hesabına veya Google Cloud projesine ihtiyacım var mı?
Hayır. Puter, Google tarafındaki ilişkiyi yönetir. Uygulamanızda Google API anahtarı tutmazsınız.
Bunu üretimde kullanabilir miyim?
Tarayıcı tabanlı uygulamalar için evet. Asıl karar noktası, kullanıcılarınızın Puter hesabıyla giriş yapma adımını kabul edip etmeyeceğidir.
Puter üzerinden Gemini, resmi API ile aynı çıktıyı mı üretir?
Puter, kullanıcı adına modeli çağırır. Model davranışı aynı model ailesine dayanır. Ancak ek bir katman olduğu için gecikme resmi API'ye göre farklı olabilir.
Gemini'nin 2M token bağlam penceresi ne olacak?
Puter her model varyantında tam 2M bağlam tavanını sunmayabilir. Çok uzun bağlam gerektiren işlerde resmi Google AI Studio API'si daha doğru seçimdir.
Discord botu veya backend servisi için kullanabilir miyim?
Temiz bir çözüm olarak hayır. Puter tarayıcı önceliklidir ve kullanıcı oturumu varsayar. Backend servisleri için resmi Gemini API'si kullanılmalıdır.
Varsayılan olarak hangi modeli seçmeliyim?
Çoğu kullanım için:
google/gemini-2.5-flash
Zor akıl yürütme için:
google/gemini-2.5-pro
Yüksek hacimli sınıflandırma için:
google/gemini-2.5-flash-lite
Görüntü oluşturma destekleniyor mu?
Puter bugün görüntü oluşturmayı Imagen üzerinden değil, OpenAI'nin gpt-image-2 ve DALL-E varyantları üzerinden sunar. Görüntü oluşturma yolu için Ücretsiz sınırsız GPT-5.5 API edinin yazısına bakabilirsiniz.
Sonuç
Puter.js, Google Cloud kurulumu yapmadan Gemini modellerini tarayıcı tabanlı uygulamalara eklemek için pratik bir yoldur. En hızlı başlangıç akışı:
- Sayfaya Puter.js script'ini ekleyin.
-
google/gemini-2.5-flashile başlayın. - Prompt'u gönderin.
- Gerekirse streaming, görüntü girişi ve çok turlu sohbet ekleyin.
- Üretim gereksinimleriniz backend, uzun bağlam veya özel Google özellikleri gerektiriyorsa resmi Gemini API'sine geçin.
Sunucu tarafı Gemini, ince ayar, kod yürütme veya tam uzun bağlam gerekiyorsa resmi Google AI Studio API'si daha uygundur. Prototipler, hackathon projeleri, statik siteler ve ücretsiz genel uygulamalar için Puter daha düşük operasyonel yükle başlamanızı sağlar.
Apidog üzerinde resmi API isteğini modelleyin, Puter prototipinizle karşılaştırın ve uygulamanız için doğru yolu seçin.
Top comments (0)