Gemini 3.5 Flash se lanzó el 19 de mayo de 2026, y Google mantuvo activo el nivel de acceso gratuito. Puedes invocar Flash hoy con una clave API gratuita; Pro llegará en junio. Si quieres usar Flash sin pagar, estas son las rutas prácticas que funcionan.
Esta guía se centra en la configuración práctica de Flash: cómo obtener acceso, cómo probarlo, cómo llamarlo desde código y qué límites debes considerar antes de integrarlo en una app.
Resumen rápido
| Ruta | Qué obtienes | Límite |
|---|---|---|
| Aplicación Gemini | Chat completo + entrada de imágenes en Flash | Límite diario de mensajes en el nivel gratuito |
| Entorno de pruebas de Google AI Studio | Interfaz web para probar Flash y ajustar parámetros | Sin cuota estricta en la interfaz de usuario |
| Clave API de AI Studio | Acceso REST/SDK a gemini-3.5-flash
|
~1.500 solicitudes/día |
| Créditos de nueva cuenta de Vertex AI | Acceso a Flash de grado de producción | 300 $ de crédito, 90 días |
| CLI de Gemini | Acceso a Flash desde terminal con inicio de sesión de Google | 1.000 solicitudes diarias |
La ruta correcta depende de tu caso de uso:
- Para chatear: aplicación Gemini.
- Para diseñar prompts: AI Studio.
- Para construir software: clave API.
- Para pruebas con más margen: Vertex AI.
- Para automatización local: CLI de Gemini.
Ruta 1: Aplicación Gemini
Si solo quieres usar Gemini 3.5 Flash sin configurar nada, empieza aquí.
- Abre gemini.google.com
- Inicia sesión con una cuenta de Google
- En el selector de modelos, elige 3.5 Flash
- Escribe tu prompt y ejecuta la conversación
La aplicación soporta texto, imágenes, carga de archivos y edición de documentos estilo Canvas. En el nivel gratuito tienes un límite diario de mensajes que se restablece cada día.
Úsala para:
- Investigación rápida.
- Redacción y resumen.
- Análisis de imágenes sin API.
- Comparar Flash con otros modelos de chat gratuitos.
No es la mejor opción para:
- Integraciones en software.
- Procesamiento por lotes.
- Flujos que requieren respuestas programables.
Ruta 2: Google AI Studio
Google AI Studio es el entorno de pruebas web para desarrolladores. Te permite probar Flash, ajustar parámetros y exportar código.
Pasos:
- Abre aistudio.google.com
- Inicia sesión
- Haz clic en Crear nuevo prompt o usa una plantilla inicial
- Selecciona
gemini-3.5-flashen el desplegable del modelo - Escribe el prompt
- Haz clic en ejecutar
Desde AI Studio puedes:
- Ajustar temperatura, top-K y top-P.
- Definir instrucciones del sistema.
- Probar salida estructurada en JSON.
- Ejecutar prompts multimodales con varias imágenes.
- Obtener código equivalente en Python o Node.js.
- Exportar el prompt a una llamada a la API de Flash.
AI Studio es la mejor ruta gratuita para iterar prompts antes de escribir código de producción.
Ruta 3: Clave API gratuita de Gemini 3.5 Flash
Esta es la ruta principal si quieres integrar Flash en una aplicación. La misma cuenta de AI Studio puede generar una clave API gratuita compatible con gemini-3.5-flash.
Obtener la clave API
- Entra en AI Studio
- Haz clic en Obtener clave API en el panel izquierdo
- Elige un proyecto existente o crea uno nuevo
- Haz clic en Crear clave API
- Copia la clave y guárdala en un gestor seguro
No necesitas tarjeta de crédito. La clave funciona inmediatamente con Flash. Si quieres el flujo completo paso a paso, consulta la guía de clave API gratuita de Gemini.
Cuotas del nivel gratuito
A mayo de 2026, el nivel gratuito para gemini-3.5-flash está aproximadamente en:
- 1.500 solicitudes por día
- 1M de tokens por minuto
- 15 solicitudes por minuto
Estos números pueden cambiar. Antes de construir algo crítico, revisa la página de precios de Google. Para entender el coste al superar el nivel gratuito, consulta el desglose de precios de Flash.
Probar la API con Python
Configura primero la variable de entorno:
export GEMINI_API_KEY="tu_clave"
Ejemplo en Python:
import os
from google import genai
client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="Give me three startup ideas for API tooling in 2026."
)
print(response.text)
Probar la API con Node.js
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({
apiKey: process.env.GEMINI_API_KEY,
});
const response = await ai.models.generateContent({
model: "gemini-3.5-flash",
contents: "Give me three startup ideas for API tooling in 2026.",
});
console.log(response.text);
Probar la API con curl
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{"contents":[{"parts":[{"text":"Hello Gemini 3.5 Flash"}]}]}'
Para configuración avanzada, streaming y llamadas a herramientas, revisa la guía de la API de Gemini 3.5 Flash.
Probar solicitudes Flash en Apidog
Si tienes 1.500 solicitudes al día, conviene evitar desperdiciarlas en requests mal formadas. Apidog te permite guardar el endpoint de Flash, almacenar la clave como variable de entorno y repetir pruebas sin reescribir curl.
Flujo recomendado:
- Descarga Apidog
- Crea una nueva solicitud
- Pega el
curlanterior - Mueve
GEMINI_API_KEYa una variable de entorno - Guarda la solicitud
- Añade aserciones sobre el código de estado y el cuerpo de respuesta
- Reejecuta la prueba cada vez que cambies el prompt
Esto ayuda a depurar prompts y payloads sin consumir cuota innecesariamente.
Ruta 4: Créditos de nueva cuenta de Vertex AI
Si creas una cuenta nueva de Google Cloud, obtienes 300 $ en créditos válidos por 90 días. Puedes usar esos créditos con Gemini 3.5 Flash en Vertex AI.
Vertex AI usa el mismo modelo, pero con controles de nivel organizacional.
Pasos:
- Regístrate en cloud.google.com
- Confirma los 300 $ de crédito
- Habilita la API de Vertex AI
- Crea una cuenta de servicio
- Asigna el rol
aiplatform.user - Descarga las credenciales JSON
- Llama a Flash con el SDK de Vertex AI
Ejemplo:
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(
project="your-project-id",
location="us-central1"
)
model = GenerativeModel("gemini-3.5-flash")
response = model.generate_content("Explain CAP theorem.")
print(response.text)
Vertex no usa el mismo límite diario que el nivel gratuito de AI Studio. En este caso, el límite práctico es el crédito disponible.
Ten en cuenta:
- El crédito caduca en 90 días.
- El crédito no utilizado se pierde.
- La conversión a pago puede activarse al expirar; desactívala si no quieres cargos.
- Vertex requiere más configuración que AI Studio.
Ruta 5: CLI de Gemini
La CLI de Gemini es el cliente de terminal de código abierto de Google. Se autentica con tu cuenta de Google y da acceso a una cuota diaria de 1.000 solicitudes contra el nivel gratuito de Gemini, sin clave API.
Instalación:
npm install -g @google/gemini-cli
Ejecución:
gemini
Dentro de la CLI, selecciona gemini-3.5-flash.
Esta ruta es útil para:
- Scripts ad-hoc desde terminal.
- Resumen de archivos.
- Exploración de código base.
- Flujos parecidos a una alternativa gratuita a Claude Code.
No la uses como ruta principal para:
- Integraciones de producción.
- Workloads que necesitan control HTTP fino.
- Servicios que requieren streaming gestionado por tu backend.
Ruta 6 extra: OpenRouter y pasarelas de terceros
Algunas pasarelas agregan acceso a modelos de IA y enrutan llamadas a Flash de forma gratuita o casi gratuita. El patrón se explica en la publicación Obtén la API de Gemini gratuita ilimitada.
Advertencias:
- La calidad y disponibilidad varían.
- Algunas pasarelas limitan tráfico de forma agresiva.
- Tus prompts pasan por un tercero.
- No envíes datos sensibles.
- Algunas aceptan pagos con criptomonedas u otros métodos alternativos.
Úsalas como respaldo, no como base de una arquitectura principal. Para proyectos reales, AI Studio o Vertex AI son opciones más directas.
Qué ruta deberías elegir
Usa esta regla rápida:
- Solo quieres chatear: aplicación Gemini.
- Estás diseñando prompts: AI Studio.
- Estás desarrollando software: clave API de AI Studio.
- Necesitas más margen y tienes cuenta nueva de GCP: Vertex AI.
- Quieres trabajar desde terminal: CLI de Gemini.
- Quieres probar agregadores externos: OpenRouter o similares.
En la práctica, muchos desarrolladores combinan dos rutas:
- AI Studio para prompts y clave API.
- Vertex AI para pruebas con más volumen.
Flash gratuito vs. de pago
El nivel gratuito es suficiente para prototipos, proyectos personales y pruebas iniciales. Considera pasar a pago cuando ocurra alguno de estos casos:
Alcanzas 1.500 solicitudes/día varios días seguidos.
En ese punto, optimizar alrededor de la cuota puede costar más que pagar.Necesitas más rendimiento por minuto.
El nivel gratuito está limitado a 15 RPM. Los niveles de pago permiten mayor throughput.Necesitas residencia de datos o registros de auditoría.
En ese caso, usa Vertex AI con una cuenta facturada.
Para tarifas por token, descuentos por lote y escenarios de coste, consulta la guía de precios de Gemini 3.5 Flash.
También conviene comparar con otros modelos. GPT-5.5 y Claude Opus 4.7 tienen rutas gratuitas con límites distintos. La comparación entre Gemini 3.5, GPT-5.5 y Opus 4.7 ayuda a decidir qué proveedor usar para cada carga.
Cómo estirar el nivel gratuito
Cinco prácticas simples:
Cachea respuestas idempotentes.
Si la misma entrada produce la misma salida, guarda el resultado.Usa modo por lotes para trabajo masivo.
El modo por lotes de la API de Gemini ofrece descuento para trabajos no interactivos y usa una cuota separada.Pide salida estructurada.
Un esquema JSON evita llamadas adicionales para limpiar texto libre.Prevalida las solicitudes.
Las aserciones de Apidog ayudan a detectar payloads mal formados antes de consumir cuota.Usa Flash por defecto.
Cuando Pro esté disponible, tendrá cuotas más estrictas. Reserva Pro para tareas que realmente lo necesiten.
Preguntas frecuentes
¿Gemini 3.5 Flash es realmente gratuito?
Sí, con límites. La aplicación Gemini, AI Studio y la clave API de AI Studio dan acceso gratuito a Flash con cuotas diarias. También existen niveles de pago para mayor rendimiento.
¿Necesito tarjeta de crédito para obtener una clave Flash gratuita?
No. El nivel gratuito de AI Studio no requiere tarjeta. Vertex AI sí requiere tarjeta para activar los 300 $ de crédito, pero no deberías recibir cargos hasta actualizar el plan.
¿Puedo usar la clave gratuita en producción?
Técnicamente sí, pero el límite de 1.500 solicitudes/día puede agotarse rápido. Para producción, usa una cuenta facturada o Vertex AI.
¿Gemini 3.5 Pro también será gratuito?
Históricamente, Google ha extendido acceso gratuito a modelos Pro durante la disponibilidad general. Se espera Pro en AI Studio con cuotas más estrictas.
¿Puedo usar Flash gratuito en Cursor o VS Code?
Sí. Ambos pueden usar claves API personalizadas. El patrón es similar al tutorial de Gemini 3.0 Pro con Cursor; solo cambia el modelo a gemini-3.5-flash.
¿Hay registros de uso en el nivel gratuito?
Sí. Abre AI Studio, selecciona tu proyecto y revisa la pestaña de actividad.
¿Cuál es la trampa?
Dos puntos importantes:
- El nivel gratuito puede usar tus prompts para mejorar los modelos de Google, aunque puedes optar por no participar desde la configuración de AI Studio.
- Los límites de tasa pueden cambiar sin previo aviso. No bases una fecha de lanzamiento crítica en cuotas gratuitas.
Proyecto inicial: API para resumir una URL
Una forma rápida de probar todo el flujo es crear una pequeña función que reciba una URL, descargue el HTML y use Flash para resumirlo.
import os
import requests
from google import genai
client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])
def summarize_url(url):
html = requests.get(url).text
response = client.models.generate_content(
model="gemini-3.5-flash",
contents=f"Summarize this webpage in 3 bullets:\n\n{html[:50000]}"
)
return response.text
print(summarize_url("https://blog.google/"))
Después puedes exponerlo como endpoint, probar la solicitud/respuesta completa en Apidog y desplegarlo en Cloud Run o en tu plataforma preferida.
Si puedes completar ese flujo, ya tienes cubierta la ruta gratuita de Gemini 3.5 Flash de extremo a extremo.





Top comments (0)