Lucas

Posted on May 20 • Originally published at apidog.com

Como Usar Gemini 3.5 Flash Grátis?

#ai #api #gemini #tutorial

O Gemini 3.5 Flash foi lançado em 19 de maio de 2026, e o Google manteve a camada de acesso gratuito ativa. Hoje, você pode usar o Flash com uma chave de API gratuita; o Pro chegará em junho. Se a meta é testar, criar protótipos ou automatizar chamadas sem pagar, estes são os caminhos que funcionam.

Experimente o Apidog hoje

Este guia mostra como configurar o acesso ao Flash na prática: escolher o caminho certo, obter uma chave gratuita, validar chamadas com código e entender os limites antes de colocar algo em produção.

Resumo rápido

Caminho	O que você obtém	Limite
Aplicativo Gemini	Chat completo + entrada de imagem no Flash	Limite diário de mensagens no nível gratuito
Playground do Google AI Studio	Interface web para testar o Flash com controle de parâmetros	Sem quota rígida na interface
Chave de API do AI Studio	Acesso REST/SDK a `gemini-3.5-flash`	~1.500 requisições/dia
Créditos de nova conta Vertex AI	Acesso Flash de nível de produção	$300 de crédito, 90 dias
CLI do Gemini	Acesso via terminal ao Flash com login do Google	1.000 requisições diárias

Escolha o caminho com base no seu caso de uso:

Quer só conversar? Use o Aplicativo Gemini.
Quer ajustar prompts? Use o AI Studio.
Quer integrar em código? Use a chave de API.
Quer controles de cloud e mais margem de uso? Use Vertex AI.
Quer usar no terminal? Use a CLI do Gemini.

Caminho 1: Aplicativo Gemini, sem configuração

Use este caminho se você só precisa interagir com o Gemini 3.5 Flash via interface web.

Passo a passo

Acesse gemini.google.com
Faça login com uma conta Google
No seletor de modelo, escolha 3.5 Flash
Envie seu prompt

O aplicativo suporta texto, entrada de imagem, upload de arquivos e edição de documentos no estilo Canvas. Usuários gratuitos recebem um limite diário de mensagens, redefinido diariamente.

Use este caminho para:

Pesquisa e escrita sem código
Análise de imagem sem configurar API
Comparar o Flash com outros modelos de chat gratuitos

Evite este caminho para:

Integrações em software
Processamento em lote
Qualquer fluxo que precise de resposta programável

Caminho 2: Google AI Studio, playground no navegador

O Google AI Studio é o melhor lugar para testar prompts antes de escrever código. Ele permite controlar parâmetros do modelo e exportar chamadas para SDK/API.

Passo a passo

Acesse aistudio.google.com
Faça login
Clique em Criar novo prompt ou escolha um template inicial
No seletor de modelo, escolha gemini-3.5-flash
Escreva o prompt
Clique em Executar

No AI Studio, você consegue:

Ajustar temperature, top-K e top-P
Definir instruções de sistema
Testar saída estruturada em JSON
Executar prompts multimodais com várias imagens
Gerar código equivalente em Python ou Node.js
Exportar o prompt para uma chamada de API Flash

O AI Studio não cobra pelo uso via navegador. Use-o para validar o comportamento do prompt antes de consumir sua cota de API.

Caminho 3: Chave de API gratuita do Gemini 3.5 Flash

Este é o caminho mais útil para desenvolvedores. A mesma conta usada no AI Studio pode gerar uma chave de API gratuita compatível com gemini-3.5-flash.

1. Gere a chave

Abra o AI Studio
Clique em Obter chave de API no menu lateral
Escolha um projeto existente ou crie um novo
Clique em Criar chave de API
Copie a chave e salve em um local seguro

A chave funciona imediatamente com o Flash. Não é necessário cartão de crédito nem verificação adicional. Para um passo a passo mais detalhado, veja o guia de chave de API Gemini gratuita.

2. Entenda as cotas gratuitas

Em maio de 2026, o nível gratuito para gemini-3.5-flash oferece aproximadamente:

1.500 requisições por dia
1M tokens por minuto
15 requisições por minuto

Esses valores podem mudar. Antes de criar lógica de produção em cima desses limites, confira a página de preços do Google. Para estimar custos após ultrapassar o gratuito, veja o detalhamento de preços do Flash.

3. Configure a variável de ambiente

Use uma variável de ambiente para evitar expor a chave no código.

export GEMINI_API_KEY="sua-chave-aqui"

Em projetos reais, use .env, secrets do CI/CD ou o gerenciador de segredos da sua cloud.

4. Teste com Python

import os
from google import genai

client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Give me three startup ideas for API tooling in 2026."
)

print(response.text)

5. Teste com Node.js

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({
  apiKey: process.env.GEMINI_API_KEY,
});

const response = await ai.models.generateContent({
  model: "gemini-3.5-flash",
  contents: "Give me three startup ideas for API tooling in 2026.",
});

console.log(response.text);

6. Teste com curl

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [
      {
        "parts": [
          {
            "text": "Hello Gemini 3.5 Flash"
          }
        ]
      }
    ]
  }'

Para uma configuração mais completa com streaming e chamadas de ferramenta, consulte o guia da API Gemini 3.5 Flash.

Teste requisições Flash gratuitas no Apidog

Se você tem 1.500 requisições por dia, cada chamada precisa ser útil. O Apidog ajuda a salvar o endpoint do Flash, guardar sua chave como variável de ambiente e repetir testes sem reescrever o curl.

Fluxo recomendado

Baixe o Apidog
Crie uma nova requisição
Cole o curl da API Gemini
Mova a chave para uma variável de ambiente
Salve a requisição
Adicione asserções para validar a resposta
Rode o teste sempre que alterar o prompt

Exemplo de asserções úteis:

Status HTTP é 200
A resposta contém candidates
O texto gerado não está vazio
O tempo de resposta está abaixo de um limite aceitável

Isso evita gastar cota depurando chamadas malformadas repetidamente. O histórico de respostas também ajuda a comparar versões de prompt.

Caminho 4: Créditos de nova conta do Vertex AI

Se você criar uma conta Google Cloud nova, pode receber $300 em créditos válidos por 90 dias. Esses créditos podem ser usados com o Gemini 3.5 Flash no Vertex AI, que oferece o mesmo modelo com controles de nível organizacional.

Passo a passo

Cadastre-se em cloud.google.com
Confirme o crédito de $300
Ative a API do Vertex AI
Crie uma conta de serviço
Conceda a permissão aiplatform.user
Baixe o arquivo JSON de credenciais
Chame o Flash via SDK do Vertex AI

Exemplo em Python

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(
    project="seu-id-de-projeto",
    location="us-central1"
)

model = GenerativeModel("gemini-3.5-flash")

response = model.generate_content(
    "Explique o teorema CAP."
)

print(response.text)

O Vertex AI não usa o mesmo limite diário da chave gratuita do AI Studio. O limite prático passa a ser o crédito disponível. Com o Flash custando cerca de $1.50/$9 por 1M de tokens, $300 podem durar bastante em uso moderado.

Antes de usar, observe:

O crédito expira em 90 dias
Crédito não utilizado é perdido
A conversão para pago pode ocorrer no vencimento, então desative se não quiser cobranças
O Vertex exige mais configuração do que o AI Studio

Use Vertex AI se você precisa de uma configuração mais próxima de produção, com IAM, contas de serviço e controles de cloud.

Caminho 5: CLI do Gemini

A CLI do Gemini é o cliente de terminal de código aberto do Google. Ela autentica com sua conta Google e oferece uma cota diária de 1.000 requisições no nível gratuito, sem precisar de chave de API.

Instalação

npm install -g @google/gemini-cli

Execução

gemini

Dentro da CLI, escolha gemini-3.5-flash.

Use a CLI para:

Scripts rápidos no terminal
Resumos de arquivos e diretórios
Exploração de codebase
Tarefas ad-hoc que você normalmente faria em uma interface de chat

Ela também pode funcionar como uma alternativa gratuita ao Claude Code, já que consegue ler arquivos e executar ferramentas.

Evite a CLI para:

Integrações de produção
Cargas que precisam de controle HTTP bruto
Pipelines que exigem observabilidade detalhada de API

Caminho 6: OpenRouter e gateways de terceiros

Alguns gateways agregam acesso a modelos de IA e roteiam chamadas para o Flash de forma gratuita ou quase gratuita. Esse padrão é abordado no post Obtenha API Gemini gratuita e ilimitada.

Use como fallback, não como base principal.

Pontos de atenção:

A qualidade e a estabilidade variam
Alguns gateways aplicam limites agressivos
Seus prompts passam por terceiros
Não envie dados sensíveis
Alguns usam métodos de pagamento ou acesso alternativos

Para builds reais, prefira AI Studio ou Vertex AI.

Qual caminho gratuito escolher?

Use esta árvore de decisão:

Apenas quer conversar? Aplicativo Gemini
Quer ajustar prompts? Playground do AI Studio
Está construindo software? Chave de API do AI Studio
Precisa de mais margem e tem nova conta GCP? Créditos do Vertex AI
Quer rodar pelo terminal? CLI do Gemini
Quer testar gateways externos? OpenRouter e similares

Na prática, muitos desenvolvedores combinam dois caminhos:

AI Studio para protótipo e chave de API
Vertex AI para testes com maior volume ou ambiente mais próximo de produção

Gratuito vs. pago: quando fazer upgrade

O nível gratuito é suficiente para muitos projetos paralelos. Considere migrar para pago quando algum destes sinais aparecer:

Você atinge 1.500 requisições/dia por vários dias seguidos.

Nesse ponto, gastar tempo contornando cotas pode custar mais do que pagar pelo uso.
Você precisa de mais throughput por minuto.

O nível gratuito limita a cerca de 15 RPM. Níveis pagos oferecem limites maiores.
Você precisa de residência de dados ou logs de auditoria.

Nesse caso, use Vertex AI em uma conta faturada.

Para estimar custos, consulte o guia de preços do Gemini 3.5 Flash.

Também vale comparar com modelos vizinhos. O GPT-5.5 e o Claude Opus 4.7 têm caminhos gratuitos com limites próprios. Em alguns casos, a estratégia mais barata é misturar provedores por tipo de workload. A comparação entre os três detalha onde cada um se destaca.

Dicas para estender o nível gratuito

Cinco práticas simples ajudam a fazer 1.500 requisições/dia renderem mais.

1. Cacheie respostas idempotentes

Se a mesma entrada sempre gera o mesmo tipo de resposta, grave o resultado.

Exemplo simples em Python:

cache = {}

def cached_generate(prompt):
    if prompt in cache:
        return cache[prompt]

    response = client.models.generate_content(
        model="gemini-3.5-flash",
        contents=prompt
    )

    cache[prompt] = response.text
    return response.text

Em produção, substitua o dicionário por Redis, banco de dados ou cache da sua plataforma.

2. Use modo em lote para trabalho massivo

Para tarefas não interativas, o modo em lote da API Gemini oferece desconto de 50% e usa uma cota separada.

Use para:

Classificação de muitos documentos
Geração de resumos em massa
Enriquecimento de dados offline
Processamento sem resposta em tempo real

3. Peça saída estruturada

Prefira JSON quando a resposta será processada por código.

Exemplo de prompt:

Responda apenas em JSON válido com este formato:

{
  "summary": "string",
  "tags": ["string"],
  "risk_level": "low | medium | high"
}

Texto:
...

Isso reduz chamadas extras para corrigir ou interpretar texto livre.

4. Pré-valide entradas

Antes de chamar o modelo, valide:

Campos obrigatórios
Tamanho máximo da entrada
Formato de URL
Tipo de arquivo
Idioma esperado
Payload JSON válido

As asserções do Apidog ajudam a capturar requisições malformadas antes que elas consumam cota.

5. Use Flash por padrão

Quando o Pro estiver disponível, ele provavelmente terá cotas mais apertadas. Use o Flash para tarefas rotineiras e reserve modelos maiores para casos que realmente precisam de mais capacidade.

Projeto inicial: API para resumir uma URL

Um bom teste ponta a ponta é criar uma pequena função que:

Recebe uma URL
Baixa o HTML
Envia parte do conteúdo para o Flash
Retorna um resumo em tópicos

Exemplo em Python

import os
import requests
from google import genai

client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])

def summarize_url(url):
    html = requests.get(url, timeout=10).text

    response = client.models.generate_content(
        model="gemini-3.5-flash",
        contents=f"Summarize this webpage in 3 bullets:\n\n{html[:50000]}"
    )

    return response.text

print(summarize_url("https://blog.google/"))

Próximos passos

Transforme a função em um endpoint HTTP
Valide a URL antes de buscar o conteúdo
Adicione timeout e tratamento de erro
Salve respostas em cache
Teste a requisição no Apidog
Implante no Cloud Run ou na sua hospedagem preferida

Se você conseguir implementar esse fluxo, já terá entendido o caminho gratuito do Flash do prompt até uma API funcional.

FAQ

O Gemini 3.5 Flash é realmente gratuito?

Sim, com limites. O aplicativo Gemini, o AI Studio e a chave de API do AI Studio oferecem acesso gratuito ao Flash com cotas diárias. Níveis pagos existem para maior throughput.

Preciso de cartão de crédito para obter uma chave Flash gratuita?

Não. O nível gratuito do AI Studio não exige cartão. O Vertex AI exige cartão para ativar o crédito de $300, mas você não será cobrado até fazer upgrade.

Posso usar a chave Flash gratuita em produção?

Tecnicamente, sim. Mas o limite de 1.500 requisições/dia pode ser atingido rapidamente. Para produção, use uma conta faturada ou Vertex AI.

O Gemini 3.5 Pro também será gratuito?

Historicamente, o Google estendeu acesso gratuito a modelos Pro na disponibilidade geral. Espere o Pro no AI Studio gratuitamente com cotas mais apertadas no próximo mês.

Posso usar o Flash gratuito no Cursor ou VS Code?

Sim. Ambos suportam chaves de API personalizadas. O padrão é semelhante ao tutorial Gemini 3.0 Pro com Cursor: troque a string do modelo para gemini-3.5-flash.

Existem logs de uso no nível gratuito?

Sim. Abra o AI Studio, clique no projeto e visualize a guia Atividade.

Qual é a pegadinha?

Duas principais:

O nível gratuito pode usar seus prompts para melhorar os modelos do Google. Verifique as opções de opt-out nas configurações do AI Studio.
Os limites de taxa do nível gratuito podem mudar sem aviso. Não baseie um lançamento crítico nesses limites.