DEV Community

Cover image for Como Usar Gemini 3.5 Flash Grátis?
Lucas
Lucas

Posted on • Originally published at apidog.com

Como Usar Gemini 3.5 Flash Grátis?

O Gemini 3.5 Flash foi lançado em 19 de maio de 2026, e o Google manteve a camada de acesso gratuito ativa. Hoje, você pode usar o Flash com uma chave de API gratuita; o Pro chegará em junho. Se a meta é testar, criar protótipos ou automatizar chamadas sem pagar, estes são os caminhos que funcionam.

Experimente o Apidog hoje

Este guia mostra como configurar o acesso ao Flash na prática: escolher o caminho certo, obter uma chave gratuita, validar chamadas com código e entender os limites antes de colocar algo em produção.

Gemini 3.5 Flash

Resumo rápido

Caminho O que você obtém Limite
Aplicativo Gemini Chat completo + entrada de imagem no Flash Limite diário de mensagens no nível gratuito
Playground do Google AI Studio Interface web para testar o Flash com controle de parâmetros Sem quota rígida na interface
Chave de API do AI Studio Acesso REST/SDK a gemini-3.5-flash ~1.500 requisições/dia
Créditos de nova conta Vertex AI Acesso Flash de nível de produção $300 de crédito, 90 dias
CLI do Gemini Acesso via terminal ao Flash com login do Google 1.000 requisições diárias

Escolha o caminho com base no seu caso de uso:

  • Quer só conversar? Use o Aplicativo Gemini.
  • Quer ajustar prompts? Use o AI Studio.
  • Quer integrar em código? Use a chave de API.
  • Quer controles de cloud e mais margem de uso? Use Vertex AI.
  • Quer usar no terminal? Use a CLI do Gemini.

Caminho 1: Aplicativo Gemini, sem configuração

Use este caminho se você só precisa interagir com o Gemini 3.5 Flash via interface web.

Passo a passo

  1. Acesse gemini.google.com
  2. Faça login com uma conta Google
  3. No seletor de modelo, escolha 3.5 Flash
  4. Envie seu prompt

Aplicativo Gemini

O aplicativo suporta texto, entrada de imagem, upload de arquivos e edição de documentos no estilo Canvas. Usuários gratuitos recebem um limite diário de mensagens, redefinido diariamente.

Use este caminho para:

Evite este caminho para:

  • Integrações em software
  • Processamento em lote
  • Qualquer fluxo que precise de resposta programável

Caminho 2: Google AI Studio, playground no navegador

O Google AI Studio é o melhor lugar para testar prompts antes de escrever código. Ele permite controlar parâmetros do modelo e exportar chamadas para SDK/API.

Passo a passo

  1. Acesse aistudio.google.com
  2. Faça login
  3. Clique em Criar novo prompt ou escolha um template inicial
  4. No seletor de modelo, escolha gemini-3.5-flash
  5. Escreva o prompt
  6. Clique em Executar

Google AI Studio

No AI Studio, você consegue:

  • Ajustar temperature, top-K e top-P
  • Definir instruções de sistema
  • Testar saída estruturada em JSON
  • Executar prompts multimodais com várias imagens
  • Gerar código equivalente em Python ou Node.js
  • Exportar o prompt para uma chamada de API Flash

O AI Studio não cobra pelo uso via navegador. Use-o para validar o comportamento do prompt antes de consumir sua cota de API.

Caminho 3: Chave de API gratuita do Gemini 3.5 Flash

Este é o caminho mais útil para desenvolvedores. A mesma conta usada no AI Studio pode gerar uma chave de API gratuita compatível com gemini-3.5-flash.

1. Gere a chave

  1. Abra o AI Studio
  2. Clique em Obter chave de API no menu lateral
  3. Escolha um projeto existente ou crie um novo
  4. Clique em Criar chave de API
  5. Copie a chave e salve em um local seguro

Chave de API Gemini

A chave funciona imediatamente com o Flash. Não é necessário cartão de crédito nem verificação adicional. Para um passo a passo mais detalhado, veja o guia de chave de API Gemini gratuita.

2. Entenda as cotas gratuitas

Em maio de 2026, o nível gratuito para gemini-3.5-flash oferece aproximadamente:

  • 1.500 requisições por dia
  • 1M tokens por minuto
  • 15 requisições por minuto

Esses valores podem mudar. Antes de criar lógica de produção em cima desses limites, confira a página de preços do Google. Para estimar custos após ultrapassar o gratuito, veja o detalhamento de preços do Flash.

3. Configure a variável de ambiente

Use uma variável de ambiente para evitar expor a chave no código.

export GEMINI_API_KEY="sua-chave-aqui"
Enter fullscreen mode Exit fullscreen mode

Em projetos reais, use .env, secrets do CI/CD ou o gerenciador de segredos da sua cloud.

4. Teste com Python

import os
from google import genai

client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Give me three startup ideas for API tooling in 2026."
)

print(response.text)
Enter fullscreen mode Exit fullscreen mode

5. Teste com Node.js

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({
  apiKey: process.env.GEMINI_API_KEY,
});

const response = await ai.models.generateContent({
  model: "gemini-3.5-flash",
  contents: "Give me three startup ideas for API tooling in 2026.",
});

console.log(response.text);
Enter fullscreen mode Exit fullscreen mode

6. Teste com curl

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [
      {
        "parts": [
          {
            "text": "Hello Gemini 3.5 Flash"
          }
        ]
      }
    ]
  }'
Enter fullscreen mode Exit fullscreen mode

Para uma configuração mais completa com streaming e chamadas de ferramenta, consulte o guia da API Gemini 3.5 Flash.

Teste requisições Flash gratuitas no Apidog

Se você tem 1.500 requisições por dia, cada chamada precisa ser útil. O Apidog ajuda a salvar o endpoint do Flash, guardar sua chave como variável de ambiente e repetir testes sem reescrever o curl.

Testando Gemini no Apidog

Fluxo recomendado

  1. Baixe o Apidog
  2. Crie uma nova requisição
  3. Cole o curl da API Gemini
  4. Mova a chave para uma variável de ambiente
  5. Salve a requisição
  6. Adicione asserções para validar a resposta
  7. Rode o teste sempre que alterar o prompt

Exemplo de asserções úteis:

  • Status HTTP é 200
  • A resposta contém candidates
  • O texto gerado não está vazio
  • O tempo de resposta está abaixo de um limite aceitável

Isso evita gastar cota depurando chamadas malformadas repetidamente. O histórico de respostas também ajuda a comparar versões de prompt.

Caminho 4: Créditos de nova conta do Vertex AI

Se você criar uma conta Google Cloud nova, pode receber $300 em créditos válidos por 90 dias. Esses créditos podem ser usados com o Gemini 3.5 Flash no Vertex AI, que oferece o mesmo modelo com controles de nível organizacional.

Passo a passo

  1. Cadastre-se em cloud.google.com
  2. Confirme o crédito de $300
  3. Ative a API do Vertex AI
  4. Crie uma conta de serviço
  5. Conceda a permissão aiplatform.user
  6. Baixe o arquivo JSON de credenciais
  7. Chame o Flash via SDK do Vertex AI

Exemplo em Python

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(
    project="seu-id-de-projeto",
    location="us-central1"
)

model = GenerativeModel("gemini-3.5-flash")

response = model.generate_content(
    "Explique o teorema CAP."
)

print(response.text)
Enter fullscreen mode Exit fullscreen mode

O Vertex AI não usa o mesmo limite diário da chave gratuita do AI Studio. O limite prático passa a ser o crédito disponível. Com o Flash custando cerca de $1.50/$9 por 1M de tokens, $300 podem durar bastante em uso moderado.

Antes de usar, observe:

  • O crédito expira em 90 dias
  • Crédito não utilizado é perdido
  • A conversão para pago pode ocorrer no vencimento, então desative se não quiser cobranças
  • O Vertex exige mais configuração do que o AI Studio

Use Vertex AI se você precisa de uma configuração mais próxima de produção, com IAM, contas de serviço e controles de cloud.

Caminho 5: CLI do Gemini

A CLI do Gemini é o cliente de terminal de código aberto do Google. Ela autentica com sua conta Google e oferece uma cota diária de 1.000 requisições no nível gratuito, sem precisar de chave de API.

Instalação

npm install -g @google/gemini-cli
Enter fullscreen mode Exit fullscreen mode

Execução

gemini
Enter fullscreen mode Exit fullscreen mode

Dentro da CLI, escolha gemini-3.5-flash.

Use a CLI para:

  • Scripts rápidos no terminal
  • Resumos de arquivos e diretórios
  • Exploração de codebase
  • Tarefas ad-hoc que você normalmente faria em uma interface de chat

Ela também pode funcionar como uma alternativa gratuita ao Claude Code, já que consegue ler arquivos e executar ferramentas.

Evite a CLI para:

  • Integrações de produção
  • Cargas que precisam de controle HTTP bruto
  • Pipelines que exigem observabilidade detalhada de API

Caminho 6: OpenRouter e gateways de terceiros

Alguns gateways agregam acesso a modelos de IA e roteiam chamadas para o Flash de forma gratuita ou quase gratuita. Esse padrão é abordado no post Obtenha API Gemini gratuita e ilimitada.

Use como fallback, não como base principal.

Pontos de atenção:

  • A qualidade e a estabilidade variam
  • Alguns gateways aplicam limites agressivos
  • Seus prompts passam por terceiros
  • Não envie dados sensíveis
  • Alguns usam métodos de pagamento ou acesso alternativos

Para builds reais, prefira AI Studio ou Vertex AI.

Qual caminho gratuito escolher?

Use esta árvore de decisão:

  • Apenas quer conversar? Aplicativo Gemini
  • Quer ajustar prompts? Playground do AI Studio
  • Está construindo software? Chave de API do AI Studio
  • Precisa de mais margem e tem nova conta GCP? Créditos do Vertex AI
  • Quer rodar pelo terminal? CLI do Gemini
  • Quer testar gateways externos? OpenRouter e similares

Na prática, muitos desenvolvedores combinam dois caminhos:

  • AI Studio para protótipo e chave de API
  • Vertex AI para testes com maior volume ou ambiente mais próximo de produção

Gratuito vs. pago: quando fazer upgrade

O nível gratuito é suficiente para muitos projetos paralelos. Considere migrar para pago quando algum destes sinais aparecer:

  1. Você atinge 1.500 requisições/dia por vários dias seguidos.

    Nesse ponto, gastar tempo contornando cotas pode custar mais do que pagar pelo uso.

  2. Você precisa de mais throughput por minuto.

    O nível gratuito limita a cerca de 15 RPM. Níveis pagos oferecem limites maiores.

  3. Você precisa de residência de dados ou logs de auditoria.

    Nesse caso, use Vertex AI em uma conta faturada.

Para estimar custos, consulte o guia de preços do Gemini 3.5 Flash.

Também vale comparar com modelos vizinhos. O GPT-5.5 e o Claude Opus 4.7 têm caminhos gratuitos com limites próprios. Em alguns casos, a estratégia mais barata é misturar provedores por tipo de workload. A comparação entre os três detalha onde cada um se destaca.

Dicas para estender o nível gratuito

Cinco práticas simples ajudam a fazer 1.500 requisições/dia renderem mais.

1. Cacheie respostas idempotentes

Se a mesma entrada sempre gera o mesmo tipo de resposta, grave o resultado.

Exemplo simples em Python:

cache = {}

def cached_generate(prompt):
    if prompt in cache:
        return cache[prompt]

    response = client.models.generate_content(
        model="gemini-3.5-flash",
        contents=prompt
    )

    cache[prompt] = response.text
    return response.text
Enter fullscreen mode Exit fullscreen mode

Em produção, substitua o dicionário por Redis, banco de dados ou cache da sua plataforma.

2. Use modo em lote para trabalho massivo

Para tarefas não interativas, o modo em lote da API Gemini oferece desconto de 50% e usa uma cota separada.

Use para:

  • Classificação de muitos documentos
  • Geração de resumos em massa
  • Enriquecimento de dados offline
  • Processamento sem resposta em tempo real

3. Peça saída estruturada

Prefira JSON quando a resposta será processada por código.

Exemplo de prompt:

Responda apenas em JSON válido com este formato:

{
  "summary": "string",
  "tags": ["string"],
  "risk_level": "low | medium | high"
}

Texto:
...
Enter fullscreen mode Exit fullscreen mode

Isso reduz chamadas extras para corrigir ou interpretar texto livre.

4. Pré-valide entradas

Antes de chamar o modelo, valide:

  • Campos obrigatórios
  • Tamanho máximo da entrada
  • Formato de URL
  • Tipo de arquivo
  • Idioma esperado
  • Payload JSON válido

As asserções do Apidog ajudam a capturar requisições malformadas antes que elas consumam cota.

5. Use Flash por padrão

Quando o Pro estiver disponível, ele provavelmente terá cotas mais apertadas. Use o Flash para tarefas rotineiras e reserve modelos maiores para casos que realmente precisam de mais capacidade.

Projeto inicial: API para resumir uma URL

Um bom teste ponta a ponta é criar uma pequena função que:

  1. Recebe uma URL
  2. Baixa o HTML
  3. Envia parte do conteúdo para o Flash
  4. Retorna um resumo em tópicos

Exemplo em Python

import os
import requests
from google import genai

client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])

def summarize_url(url):
    html = requests.get(url, timeout=10).text

    response = client.models.generate_content(
        model="gemini-3.5-flash",
        contents=f"Summarize this webpage in 3 bullets:\n\n{html[:50000]}"
    )

    return response.text

print(summarize_url("https://blog.google/"))
Enter fullscreen mode Exit fullscreen mode

Próximos passos

  • Transforme a função em um endpoint HTTP
  • Valide a URL antes de buscar o conteúdo
  • Adicione timeout e tratamento de erro
  • Salve respostas em cache
  • Teste a requisição no Apidog
  • Implante no Cloud Run ou na sua hospedagem preferida

Se você conseguir implementar esse fluxo, já terá entendido o caminho gratuito do Flash do prompt até uma API funcional.

FAQ

O Gemini 3.5 Flash é realmente gratuito?

Sim, com limites. O aplicativo Gemini, o AI Studio e a chave de API do AI Studio oferecem acesso gratuito ao Flash com cotas diárias. Níveis pagos existem para maior throughput.

Preciso de cartão de crédito para obter uma chave Flash gratuita?

Não. O nível gratuito do AI Studio não exige cartão. O Vertex AI exige cartão para ativar o crédito de $300, mas você não será cobrado até fazer upgrade.

Posso usar a chave Flash gratuita em produção?

Tecnicamente, sim. Mas o limite de 1.500 requisições/dia pode ser atingido rapidamente. Para produção, use uma conta faturada ou Vertex AI.

O Gemini 3.5 Pro também será gratuito?

Historicamente, o Google estendeu acesso gratuito a modelos Pro na disponibilidade geral. Espere o Pro no AI Studio gratuitamente com cotas mais apertadas no próximo mês.

Posso usar o Flash gratuito no Cursor ou VS Code?

Sim. Ambos suportam chaves de API personalizadas. O padrão é semelhante ao tutorial Gemini 3.0 Pro com Cursor: troque a string do modelo para gemini-3.5-flash.

Existem logs de uso no nível gratuito?

Sim. Abra o AI Studio, clique no projeto e visualize a guia Atividade.

Qual é a pegadinha?

Duas principais:

  1. O nível gratuito pode usar seus prompts para melhorar os modelos do Google. Verifique as opções de opt-out nas configurações do AI Studio.
  2. Os limites de taxa do nível gratuito podem mudar sem aviso. Não baseie um lançamento crítico nesses limites.

Top comments (0)