O Gemini 3.5 Flash foi lançado em 19 de maio de 2026, e o Google manteve a camada de acesso gratuito ativa. Hoje, você pode usar o Flash com uma chave de API gratuita; o Pro chegará em junho. Se a meta é testar, criar protótipos ou automatizar chamadas sem pagar, estes são os caminhos que funcionam.
Este guia mostra como configurar o acesso ao Flash na prática: escolher o caminho certo, obter uma chave gratuita, validar chamadas com código e entender os limites antes de colocar algo em produção.
Resumo rápido
| Caminho | O que você obtém | Limite |
|---|---|---|
| Aplicativo Gemini | Chat completo + entrada de imagem no Flash | Limite diário de mensagens no nível gratuito |
| Playground do Google AI Studio | Interface web para testar o Flash com controle de parâmetros | Sem quota rígida na interface |
| Chave de API do AI Studio | Acesso REST/SDK a gemini-3.5-flash
|
~1.500 requisições/dia |
| Créditos de nova conta Vertex AI | Acesso Flash de nível de produção | $300 de crédito, 90 dias |
| CLI do Gemini | Acesso via terminal ao Flash com login do Google | 1.000 requisições diárias |
Escolha o caminho com base no seu caso de uso:
- Quer só conversar? Use o Aplicativo Gemini.
- Quer ajustar prompts? Use o AI Studio.
- Quer integrar em código? Use a chave de API.
- Quer controles de cloud e mais margem de uso? Use Vertex AI.
- Quer usar no terminal? Use a CLI do Gemini.
Caminho 1: Aplicativo Gemini, sem configuração
Use este caminho se você só precisa interagir com o Gemini 3.5 Flash via interface web.
Passo a passo
- Acesse gemini.google.com
- Faça login com uma conta Google
- No seletor de modelo, escolha 3.5 Flash
- Envie seu prompt
O aplicativo suporta texto, entrada de imagem, upload de arquivos e edição de documentos no estilo Canvas. Usuários gratuitos recebem um limite diário de mensagens, redefinido diariamente.
Use este caminho para:
- Pesquisa e escrita sem código
- Análise de imagem sem configurar API
- Comparar o Flash com outros modelos de chat gratuitos
Evite este caminho para:
- Integrações em software
- Processamento em lote
- Qualquer fluxo que precise de resposta programável
Caminho 2: Google AI Studio, playground no navegador
O Google AI Studio é o melhor lugar para testar prompts antes de escrever código. Ele permite controlar parâmetros do modelo e exportar chamadas para SDK/API.
Passo a passo
- Acesse aistudio.google.com
- Faça login
- Clique em Criar novo prompt ou escolha um template inicial
- No seletor de modelo, escolha
gemini-3.5-flash - Escreva o prompt
- Clique em Executar
No AI Studio, você consegue:
- Ajustar
temperature,top-Ketop-P - Definir instruções de sistema
- Testar saída estruturada em JSON
- Executar prompts multimodais com várias imagens
- Gerar código equivalente em Python ou Node.js
- Exportar o prompt para uma chamada de API Flash
O AI Studio não cobra pelo uso via navegador. Use-o para validar o comportamento do prompt antes de consumir sua cota de API.
Caminho 3: Chave de API gratuita do Gemini 3.5 Flash
Este é o caminho mais útil para desenvolvedores. A mesma conta usada no AI Studio pode gerar uma chave de API gratuita compatível com gemini-3.5-flash.
1. Gere a chave
- Abra o AI Studio
- Clique em Obter chave de API no menu lateral
- Escolha um projeto existente ou crie um novo
- Clique em Criar chave de API
- Copie a chave e salve em um local seguro
A chave funciona imediatamente com o Flash. Não é necessário cartão de crédito nem verificação adicional. Para um passo a passo mais detalhado, veja o guia de chave de API Gemini gratuita.
2. Entenda as cotas gratuitas
Em maio de 2026, o nível gratuito para gemini-3.5-flash oferece aproximadamente:
- 1.500 requisições por dia
- 1M tokens por minuto
- 15 requisições por minuto
Esses valores podem mudar. Antes de criar lógica de produção em cima desses limites, confira a página de preços do Google. Para estimar custos após ultrapassar o gratuito, veja o detalhamento de preços do Flash.
3. Configure a variável de ambiente
Use uma variável de ambiente para evitar expor a chave no código.
export GEMINI_API_KEY="sua-chave-aqui"
Em projetos reais, use .env, secrets do CI/CD ou o gerenciador de segredos da sua cloud.
4. Teste com Python
import os
from google import genai
client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="Give me three startup ideas for API tooling in 2026."
)
print(response.text)
5. Teste com Node.js
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({
apiKey: process.env.GEMINI_API_KEY,
});
const response = await ai.models.generateContent({
model: "gemini-3.5-flash",
contents: "Give me three startup ideas for API tooling in 2026.",
});
console.log(response.text);
6. Teste com curl
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [
{
"parts": [
{
"text": "Hello Gemini 3.5 Flash"
}
]
}
]
}'
Para uma configuração mais completa com streaming e chamadas de ferramenta, consulte o guia da API Gemini 3.5 Flash.
Teste requisições Flash gratuitas no Apidog
Se você tem 1.500 requisições por dia, cada chamada precisa ser útil. O Apidog ajuda a salvar o endpoint do Flash, guardar sua chave como variável de ambiente e repetir testes sem reescrever o curl.
Fluxo recomendado
- Baixe o Apidog
- Crie uma nova requisição
- Cole o
curlda API Gemini - Mova a chave para uma variável de ambiente
- Salve a requisição
- Adicione asserções para validar a resposta
- Rode o teste sempre que alterar o prompt
Exemplo de asserções úteis:
- Status HTTP é
200 - A resposta contém
candidates - O texto gerado não está vazio
- O tempo de resposta está abaixo de um limite aceitável
Isso evita gastar cota depurando chamadas malformadas repetidamente. O histórico de respostas também ajuda a comparar versões de prompt.
Caminho 4: Créditos de nova conta do Vertex AI
Se você criar uma conta Google Cloud nova, pode receber $300 em créditos válidos por 90 dias. Esses créditos podem ser usados com o Gemini 3.5 Flash no Vertex AI, que oferece o mesmo modelo com controles de nível organizacional.
Passo a passo
- Cadastre-se em cloud.google.com
- Confirme o crédito de $300
- Ative a API do Vertex AI
- Crie uma conta de serviço
- Conceda a permissão
aiplatform.user - Baixe o arquivo JSON de credenciais
- Chame o Flash via SDK do Vertex AI
Exemplo em Python
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(
project="seu-id-de-projeto",
location="us-central1"
)
model = GenerativeModel("gemini-3.5-flash")
response = model.generate_content(
"Explique o teorema CAP."
)
print(response.text)
O Vertex AI não usa o mesmo limite diário da chave gratuita do AI Studio. O limite prático passa a ser o crédito disponível. Com o Flash custando cerca de $1.50/$9 por 1M de tokens, $300 podem durar bastante em uso moderado.
Antes de usar, observe:
- O crédito expira em 90 dias
- Crédito não utilizado é perdido
- A conversão para pago pode ocorrer no vencimento, então desative se não quiser cobranças
- O Vertex exige mais configuração do que o AI Studio
Use Vertex AI se você precisa de uma configuração mais próxima de produção, com IAM, contas de serviço e controles de cloud.
Caminho 5: CLI do Gemini
A CLI do Gemini é o cliente de terminal de código aberto do Google. Ela autentica com sua conta Google e oferece uma cota diária de 1.000 requisições no nível gratuito, sem precisar de chave de API.
Instalação
npm install -g @google/gemini-cli
Execução
gemini
Dentro da CLI, escolha gemini-3.5-flash.
Use a CLI para:
- Scripts rápidos no terminal
- Resumos de arquivos e diretórios
- Exploração de codebase
- Tarefas ad-hoc que você normalmente faria em uma interface de chat
Ela também pode funcionar como uma alternativa gratuita ao Claude Code, já que consegue ler arquivos e executar ferramentas.
Evite a CLI para:
- Integrações de produção
- Cargas que precisam de controle HTTP bruto
- Pipelines que exigem observabilidade detalhada de API
Caminho 6: OpenRouter e gateways de terceiros
Alguns gateways agregam acesso a modelos de IA e roteiam chamadas para o Flash de forma gratuita ou quase gratuita. Esse padrão é abordado no post Obtenha API Gemini gratuita e ilimitada.
Use como fallback, não como base principal.
Pontos de atenção:
- A qualidade e a estabilidade variam
- Alguns gateways aplicam limites agressivos
- Seus prompts passam por terceiros
- Não envie dados sensíveis
- Alguns usam métodos de pagamento ou acesso alternativos
Para builds reais, prefira AI Studio ou Vertex AI.
Qual caminho gratuito escolher?
Use esta árvore de decisão:
- Apenas quer conversar? Aplicativo Gemini
- Quer ajustar prompts? Playground do AI Studio
- Está construindo software? Chave de API do AI Studio
- Precisa de mais margem e tem nova conta GCP? Créditos do Vertex AI
- Quer rodar pelo terminal? CLI do Gemini
- Quer testar gateways externos? OpenRouter e similares
Na prática, muitos desenvolvedores combinam dois caminhos:
- AI Studio para protótipo e chave de API
- Vertex AI para testes com maior volume ou ambiente mais próximo de produção
Gratuito vs. pago: quando fazer upgrade
O nível gratuito é suficiente para muitos projetos paralelos. Considere migrar para pago quando algum destes sinais aparecer:
Você atinge 1.500 requisições/dia por vários dias seguidos.
Nesse ponto, gastar tempo contornando cotas pode custar mais do que pagar pelo uso.Você precisa de mais throughput por minuto.
O nível gratuito limita a cerca de 15 RPM. Níveis pagos oferecem limites maiores.Você precisa de residência de dados ou logs de auditoria.
Nesse caso, use Vertex AI em uma conta faturada.
Para estimar custos, consulte o guia de preços do Gemini 3.5 Flash.
Também vale comparar com modelos vizinhos. O GPT-5.5 e o Claude Opus 4.7 têm caminhos gratuitos com limites próprios. Em alguns casos, a estratégia mais barata é misturar provedores por tipo de workload. A comparação entre os três detalha onde cada um se destaca.
Dicas para estender o nível gratuito
Cinco práticas simples ajudam a fazer 1.500 requisições/dia renderem mais.
1. Cacheie respostas idempotentes
Se a mesma entrada sempre gera o mesmo tipo de resposta, grave o resultado.
Exemplo simples em Python:
cache = {}
def cached_generate(prompt):
if prompt in cache:
return cache[prompt]
response = client.models.generate_content(
model="gemini-3.5-flash",
contents=prompt
)
cache[prompt] = response.text
return response.text
Em produção, substitua o dicionário por Redis, banco de dados ou cache da sua plataforma.
2. Use modo em lote para trabalho massivo
Para tarefas não interativas, o modo em lote da API Gemini oferece desconto de 50% e usa uma cota separada.
Use para:
- Classificação de muitos documentos
- Geração de resumos em massa
- Enriquecimento de dados offline
- Processamento sem resposta em tempo real
3. Peça saída estruturada
Prefira JSON quando a resposta será processada por código.
Exemplo de prompt:
Responda apenas em JSON válido com este formato:
{
"summary": "string",
"tags": ["string"],
"risk_level": "low | medium | high"
}
Texto:
...
Isso reduz chamadas extras para corrigir ou interpretar texto livre.
4. Pré-valide entradas
Antes de chamar o modelo, valide:
- Campos obrigatórios
- Tamanho máximo da entrada
- Formato de URL
- Tipo de arquivo
- Idioma esperado
- Payload JSON válido
As asserções do Apidog ajudam a capturar requisições malformadas antes que elas consumam cota.
5. Use Flash por padrão
Quando o Pro estiver disponível, ele provavelmente terá cotas mais apertadas. Use o Flash para tarefas rotineiras e reserve modelos maiores para casos que realmente precisam de mais capacidade.
Projeto inicial: API para resumir uma URL
Um bom teste ponta a ponta é criar uma pequena função que:
- Recebe uma URL
- Baixa o HTML
- Envia parte do conteúdo para o Flash
- Retorna um resumo em tópicos
Exemplo em Python
import os
import requests
from google import genai
client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])
def summarize_url(url):
html = requests.get(url, timeout=10).text
response = client.models.generate_content(
model="gemini-3.5-flash",
contents=f"Summarize this webpage in 3 bullets:\n\n{html[:50000]}"
)
return response.text
print(summarize_url("https://blog.google/"))
Próximos passos
- Transforme a função em um endpoint HTTP
- Valide a URL antes de buscar o conteúdo
- Adicione timeout e tratamento de erro
- Salve respostas em cache
- Teste a requisição no Apidog
- Implante no Cloud Run ou na sua hospedagem preferida
Se você conseguir implementar esse fluxo, já terá entendido o caminho gratuito do Flash do prompt até uma API funcional.
FAQ
O Gemini 3.5 Flash é realmente gratuito?
Sim, com limites. O aplicativo Gemini, o AI Studio e a chave de API do AI Studio oferecem acesso gratuito ao Flash com cotas diárias. Níveis pagos existem para maior throughput.
Preciso de cartão de crédito para obter uma chave Flash gratuita?
Não. O nível gratuito do AI Studio não exige cartão. O Vertex AI exige cartão para ativar o crédito de $300, mas você não será cobrado até fazer upgrade.
Posso usar a chave Flash gratuita em produção?
Tecnicamente, sim. Mas o limite de 1.500 requisições/dia pode ser atingido rapidamente. Para produção, use uma conta faturada ou Vertex AI.
O Gemini 3.5 Pro também será gratuito?
Historicamente, o Google estendeu acesso gratuito a modelos Pro na disponibilidade geral. Espere o Pro no AI Studio gratuitamente com cotas mais apertadas no próximo mês.
Posso usar o Flash gratuito no Cursor ou VS Code?
Sim. Ambos suportam chaves de API personalizadas. O padrão é semelhante ao tutorial Gemini 3.0 Pro com Cursor: troque a string do modelo para gemini-3.5-flash.
Existem logs de uso no nível gratuito?
Sim. Abra o AI Studio, clique no projeto e visualize a guia Atividade.
Qual é a pegadinha?
Duas principais:
- O nível gratuito pode usar seus prompts para melhorar os modelos do Google. Verifique as opções de opt-out nas configurações do AI Studio.
- Os limites de taxa do nível gratuito podem mudar sem aviso. Não baseie um lançamento crítico nesses limites.





Top comments (0)