Gemini 3.5 Flash diluncurkan pada 19 Mei 2026, dan Google mempertahankan akses gratisnya. Anda bisa memanggil Flash dari kunci API gratis hari ini; versi Pro akan hadir pada bulan Juni. Jika ingin menggunakan Flash tanpa membayar, berikut lima jalur yang bisa langsung Anda pakai.
Panduan ini fokus pada implementasi praktis untuk Flash: cara mendapatkan akses, membuat kunci API, menjalankan contoh kode, dan memahami batas gratisnya.
Ringkasan singkat
| Cara | Apa yang Anda dapatkan | Batas |
|---|---|---|
| Aplikasi Gemini | Obrolan penuh + input gambar di Flash | Batas pesan harian pada tingkat gratis |
| Google AI Studio | Playground web untuk mencoba Flash dengan kontrol parameter | Tidak ada kuota keras di UI |
| Kunci API AI Studio | Akses REST/SDK ke gemini-3.5-flash
|
~1.500 permintaan/hari |
| Kredit akun baru Vertex AI | Akses Flash tingkat produksi | Kredit $300, 90 hari |
| Gemini CLI | Akses terminal ke Flash dengan login Google | 1.000 permintaan harian |
Pilih jalur berdasarkan kebutuhan Anda:
- Ingin mencoba model: gunakan aplikasi Gemini.
- Ingin menguji prompt: gunakan Google AI Studio.
- Ingin membangun aplikasi: gunakan kunci API AI Studio.
- Butuh kontrol organisasi: gunakan Vertex AI.
- Ingin scripting dari terminal: gunakan Gemini CLI.
Cara 1: Aplikasi Gemini untuk penggunaan tanpa setup
Jika Anda hanya ingin mencoba Gemini 3.5 Flash tanpa API, gunakan aplikasi Gemini.
Langkahnya:
- Buka gemini.google.com
- Masuk dengan akun Google
- Di pemilih model, pilih 3.5 Flash
- Mulai mengobrol
Aplikasi Gemini mendukung teks, input gambar, unggahan file, dan pengeditan dokumen gaya Canvas. Pengguna tingkat gratis mendapatkan batas pesan harian yang direset setiap hari.
Gunakan jalur ini untuk:
- Riset cepat
- Penulisan dan brainstorming
- Analisis gambar tanpa API
- Membandingkan Flash dengan model obrolan gratis lainnya
Jangan gunakan jalur ini untuk:
- Integrasi aplikasi
- Pemrosesan batch
- Workflow yang membutuhkan response terprogram
Cara 2: Google AI Studio untuk eksperimen prompt
Google AI Studio adalah playground pengembang untuk Gemini. Anda bisa menguji prompt, parameter, dan output sebelum menulis kode.
Langkahnya:
- Buka aistudio.google.com
- Masuk dengan akun Google
- Klik Create new prompt
- Di dropdown model, pilih
gemini-3.5-flash - Masukkan prompt
- Klik Run
Di AI Studio, Anda bisa:
- Mengatur
temperature,top-K, dantop-P - Menambahkan system instruction
- Menguji output JSON terstruktur
- Menjalankan prompt multimodal dengan beberapa gambar
- Mengambil contoh kode Python atau Node.js
- Mengekspor prompt menjadi panggilan API Flash
AI Studio cocok untuk rekayasa prompt sebelum Anda mengubahnya menjadi endpoint produksi.
Cara 3: Kunci API Gemini 3.5 Flash gratis untuk membangun aplikasi
Untuk developer, jalur paling berguna adalah kunci API gratis dari AI Studio. Kunci ini bisa digunakan untuk memanggil model gemini-3.5-flash.
1. Buat kunci API
Langkahnya:
- Buka AI Studio
- Klik Get API key di navigasi kiri
- Pilih proyek yang ada atau buat proyek baru
- Klik Create API key
- Salin kunci API dan simpan di tempat aman
Tidak perlu kartu kredit. Kunci API langsung bisa digunakan untuk Flash. Jika butuh panduan lebih detail, lihat panduan kunci API Gemini gratis.
2. Pahami kuota gratis
Per Mei 2026, tingkat gratis Google untuk gemini-3.5-flash kira-kira:
- 1.500 permintaan per hari
- 1 juta token per menit
- 15 permintaan per menit
Batas ini dapat berubah. Periksa halaman harga Google sebelum memakai angka tersebut untuk perencanaan produksi. Untuk simulasi biaya saat melewati batas gratis, lihat rincian harga Flash.
3. Simpan API key sebagai environment variable
Gunakan environment variable agar kunci tidak masuk ke source code.
export GEMINI_API_KEY="masukkan-api-key-anda"
Untuk Windows PowerShell:
$env:GEMINI_API_KEY="masukkan-api-key-anda"
4. Uji dengan Python
import os
from google import genai
client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="Beri saya tiga ide startup untuk alat API pada tahun 2026."
)
print(response.text)
5. Uji dengan Node.js
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({
apiKey: process.env.GEMINI_API_KEY,
});
const response = await ai.models.generateContent({
model: "gemini-3.5-flash",
contents: "Beri saya tiga ide startup untuk alat API pada tahun 2026.",
});
console.log(response.text);
6. Uji dengan curl
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [
{
"parts": [
{
"text": "Halo Gemini 3.5 Flash"
}
]
}
]
}'
Untuk pengaturan lanjutan seperti streaming dan tool calling, lihat panduan API Gemini 3.5 Flash.
7. Uji request Flash di Apidog
Jika Anda memiliki kuota 1.500 request/hari, hindari membuang kuota untuk request yang salah format. Apidog membantu Anda menyimpan endpoint Flash, memakai API key sebagai environment variable, dan menjalankan ulang request tanpa menulis ulang curl.
Workflow praktis:
- Unduh Apidog
- Buat request baru
- Tempel curl Gemini dari contoh di atas
- Pindahkan API key ke environment variable Apidog
- Simpan request
- Tambahkan assertion response
- Jalankan ulang saat Anda mengubah prompt
Manfaat utamanya: Anda bisa melihat riwayat response, membandingkan hasil prompt, dan menghindari request rusak yang menghabiskan kuota.
Cara 4: Kredit akun baru Vertex AI
Jika membuat akun Google Cloud baru, Anda bisa mendapatkan kredit $300 yang berlaku selama 90 hari. Kredit ini dapat digunakan untuk endpoint Gemini 3.5 Flash yang di-host oleh Vertex AI.
Gunakan Vertex AI jika Anda membutuhkan:
- Kontrol proyek Google Cloud
- Service account
- IAM
- Integrasi dengan infrastruktur GCP
- Jalur yang lebih dekat ke produksi
Langkah dasar:
- Daftar di cloud.google.com
- Konfirmasi kredit $300
- Aktifkan Vertex AI API
- Buat service account
- Berikan role
aiplatform.user - Unduh kredensial JSON
- Panggil Flash melalui Vertex AI SDK
Contoh Python:
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(
project="id-proyek-anda",
location="us-central1"
)
model = GenerativeModel("gemini-3.5-flash")
response = model.generate_content("Jelaskan teorema CAP.")
print(response.text)
Vertex AI tidak memakai batas request harian yang sama seperti tingkat gratis AI Studio. Anda dibatasi oleh kredit dolar. Dengan harga Flash sekitar $1.50/$9 per 1 juta token, kredit $300 dapat bertahan lama untuk penggunaan moderat.
Hal yang perlu diperhatikan:
- Kredit kedaluwarsa dalam 90 hari
- Kredit yang tidak dipakai akan hangus
- Pastikan Anda memahami pengaturan billing
- Vertex membutuhkan setup lebih banyak dibanding AI Studio
Cara 5: Gemini CLI untuk terminal
Gemini CLI adalah klien terminal open-source dari Google. CLI ini login dengan akun Google dan memberi kuota harian 1.000 request terhadap tingkat gratis Gemini, tanpa memerlukan API key.
Instal:
npm install -g @google/gemini-cli
Jalankan:
gemini
Di dalam CLI, pilih model:
gemini-3.5-flash
Gemini CLI cocok untuk:
- Scripting cepat dari terminal
- Ringkasan file atau basis kode
- Workflow
grep+ prompt - Eksperimen tanpa membuat API key
- Kuota harian terpisah dari kuota API key
CLI ini juga dapat digunakan sebagai alternatif Claude Code gratis untuk pekerjaan pengkodean, karena dapat membaca file dan menjalankan tool.
Jangan gunakan CLI untuk:
- Integrasi produksi
- Workflow yang membutuhkan kontrol HTTP mentah
- Sistem yang perlu observability API lengkap
Cara 6 bonus: OpenRouter dan gateway pihak ketiga
Beberapa gateway pihak ketiga menggabungkan akses ke berbagai model AI dan dapat merutekan panggilan Flash gratis atau hampir gratis. Polanya dibahas dalam artikel Dapatkan API Gemini Tak Terbatas Gratis.
Gunakan opsi ini sebagai cadangan, bukan stack utama.
Risikonya:
- Kualitas dan batas rate dapat bervariasi
- Prompt Anda melewati pihak ketiga
- Jangan kirim data sensitif
- Beberapa layanan memakai metode pembayaran atau aturan akses berbeda
Untuk pengembangan serius, gunakan AI Studio atau Vertex AI.
Jalur mana yang sebaiknya Anda pilih?
Gunakan panduan cepat ini:
- Hanya ingin mengobrol? Gunakan aplikasi Gemini.
- Sedang menyusun prompt? Gunakan AI Studio.
- Membangun aplikasi? Gunakan kunci API AI Studio.
- Butuh kontrol GCP dan kuota berbasis kredit? Gunakan Vertex AI.
- Butuh workflow terminal? Gunakan Gemini CLI.
- Mau mencoba gateway pihak ketiga? Gunakan OpenRouter atau layanan serupa sebagai cadangan.
Untuk sebagian besar developer, kombinasi paling praktis adalah:
- AI Studio untuk menyusun prompt
- Kunci API AI Studio untuk implementasi
- Apidog untuk menyimpan dan menguji request
- Vertex AI jika butuh jalur produksi berbasis GCP
Kapan harus beralih dari gratis ke berbayar?
Tingkat gratis cukup untuk banyak proyek sampingan. Namun, pertimbangkan upgrade jika Anda mengalami salah satu kondisi berikut.
1. Kuota harian sering habis
Jika Anda mencapai 1.500 request/hari beberapa hari berturut-turut, waktu yang Anda habiskan untuk menghindari batas kuota bisa lebih mahal daripada biaya API berbayar.
2. Butuh throughput lebih tinggi
Tingkat gratis dibatasi sekitar 15 request per menit. Jika aplikasi Anda membutuhkan throughput lebih tinggi, gunakan tingkat berbayar.
3. Butuh kontrol organisasi
Jika Anda membutuhkan residensi data, audit log, IAM, atau kontrol organisasi, pindah ke Vertex AI pada akun berbayar.
Untuk simulasi biaya berbayar, diskon batch, dan skenario token dunia nyata, lihat panduan harga Gemini 3.5 Flash.
Anda juga bisa membandingkan dengan model lain. GPT-5.5 dan Claude Opus 4.7 memiliki jalur gratis dengan batas berbeda. Lihat juga perbandingan tiga arah.
Tips agar kuota gratis Flash lebih awet
Gunakan kebiasaan berikut saat membangun aplikasi dengan Flash.
1. Cache request idempoten
Jika input sama menghasilkan output yang sama, simpan hasilnya.
Contoh pola sederhana:
cache = {}
def ask_flash(prompt):
if prompt in cache:
return cache[prompt]
response = client.models.generate_content(
model="gemini-3.5-flash",
contents=prompt
)
cache[prompt] = response.text
return response.text
2. Validasi input sebelum memanggil API
Jangan kirim request kosong, terlalu panjang, atau salah format.
def validate_prompt(prompt):
if not prompt.strip():
raise ValueError("Prompt tidak boleh kosong")
if len(prompt) > 50000:
raise ValueError("Prompt terlalu panjang")
return prompt
3. Gunakan output terstruktur
Jika Anda butuh JSON, minta JSON sejak awal. Ini mengurangi kebutuhan retry dan parsing manual.
Contoh prompt:
Kembalikan jawaban dalam JSON valid dengan struktur:
{
"summary": "string",
"tags": ["string"],
"risk_level": "low | medium | high"
}
4. Gunakan batch untuk pekerjaan non-real-time
Untuk pekerjaan massal yang tidak butuh response langsung, lihat mode batch API Gemini. Mode batch memberi diskon 50% untuk pekerjaan non-real-time dan dihitung terhadap kuota terpisah.
5. Uji request di Apidog sebelum masuk kode
Assertion Apidog membantu menangkap request rusak sebelum menghabiskan kuota.
Contoh hal yang bisa Anda validasi:
- Status code
- Struktur JSON response
- Field wajib
- Response time
- Error message
6. Pakai Flash sebagai default
Ketika Pro tersedia, model tersebut kemungkinan memiliki kuota lebih ketat. Gunakan Flash untuk pekerjaan rutin dan simpan Pro untuk tugas yang benar-benar membutuhkan kemampuan lebih tinggi.
FAQ
Apakah Gemini 3.5 Flash benar-benar gratis?
Ya, dengan batasan. Aplikasi Gemini, AI Studio, dan kunci API AI Studio memberi akses Flash gratis dengan kuota harian. Tingkat berbayar tersedia untuk throughput lebih tinggi.
Apakah saya perlu kartu kredit untuk mendapatkan kunci Flash gratis?
Tidak. Tingkat gratis AI Studio tidak memerlukan kartu kredit. Vertex AI membutuhkan kartu untuk kredit $300, tetapi Anda tidak dikenakan biaya sampai meningkatkan atau memakai billing sesuai ketentuan Google Cloud.
Apakah kunci Flash gratis bisa digunakan di produksi?
Secara teknis bisa, tetapi batas 1.500 request/hari dapat cepat tercapai. Untuk produksi, gunakan akun berbayar atau Vertex AI.
Apakah Gemini 3.5 Pro juga akan gratis?
Google secara historis memperluas akses tingkat gratis ke model Pro pada GA. Pro di AI Studio diperkirakan tersedia gratis dengan kuota lebih ketat bulan depan.
Apakah Flash gratis bisa digunakan di Cursor atau VS Code?
Ya. Keduanya mendukung API key kustom. Polanya sama seperti panduan Gemini 3.0 Pro dengan Cursor, cukup ganti string model menjadi:
gemini-3.5-flash
Apakah ada log penggunaan pada tingkat gratis?
Ya. Buka AI Studio, pilih proyek Anda, lalu lihat tab aktivitas.
Apa kelemahan tingkat gratis?
Dua hal utama:
- Tingkat gratis dapat menggunakan prompt Anda untuk meningkatkan model Google, dengan opsi keluar di pengaturan AI Studio.
- Batas rate tingkat gratis dapat berubah tanpa pemberitahuan.
Jangan menggantungkan deadline produksi pada kuota gratis.
Proyek pemula: API ringkasan URL dengan Flash
Untuk memahami alur end-to-end, buat service kecil yang:
- Menerima URL
- Mengambil HTML halaman
- Mengirim konten ke Gemini 3.5 Flash
- Mengembalikan ringkasan
Contoh minimal:
import os
import requests
from google import genai
client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])
def summarize_url(url):
html = requests.get(url).text
response = client.models.generate_content(
model="gemini-3.5-flash",
contents=f"Ringkas halaman web ini dalam 3 poin:\n\n{html[:50000]}"
)
return response.text
print(summarize_url("https://blog.google/"))
Setelah contoh ini berjalan:
- Bungkus fungsi menjadi endpoint API.
- Simpan
GEMINI_API_KEYsebagai environment variable. - Uji request dan response di Apidog.
- Tambahkan validasi URL.
- Tambahkan caching.
- Deploy ke Cloud Run atau platform hosting pilihan Anda.
Jika Anda bisa menyelesaikan proyek ini, Anda sudah memahami jalur gratis Gemini 3.5 Flash dari prompt, API key, request, response, hingga deployment.





Top comments (0)