Antoine Laurent

Posted on May 20 • Originally published at apidog.com

Comment utiliser Gemini 3.5 Flash gratuitement ?

Gemini 3.5 Flash a été lancé le 19 mai 2026, et Google a conservé un niveau d’accès gratuit. Flash est disponible dès maintenant avec une clé API gratuite ; Pro arrive en juin. Si vous voulez utiliser Flash sans payer, voici les voies réellement exploitables côté développeur.

Essayez Apidog aujourd’hui

Ce guide se concentre sur la mise en place pratique : obtenir une clé, tester des appels API, comprendre les quotas et choisir le bon chemin selon votre usage.

Résumé rapide

Voie	Ce que vous obtenez	Limite
Application Gemini	Chat complet + saisie d’images avec Flash	Plafond quotidien de messages sur le niveau gratuit
Google AI Studio	Aire de jeux web avec contrôle des paramètres	Pas de quota strict dans l’interface
Clé API AI Studio	Accès REST/SDK à `gemini-3.5-flash`	~1 500 requêtes/jour
Crédits nouveau compte Vertex AI	Accès Flash orienté production	300 $ de crédit, 90 jours
CLI Gemini	Accès terminal à Flash via connexion Google	1 000 requêtes quotidiennes

Chaque voie répond à un besoin différent : discuter, prototyper une invite, intégrer Flash dans une application ou exécuter des scripts.

Voie 1 : Application Gemini, sans configuration

Utilisez cette voie si vous voulez simplement tester Flash dans une interface de chat.

Ouvrez gemini.google.com
Connectez-vous avec un compte Google
Dans le sélecteur de modèle, choisissez 3.5 Flash
Lancez une conversation

L’application prend en charge le texte, les images, les fichiers et l’édition de documents de type Canvas. Sur le niveau gratuit, vous disposez d’un plafond quotidien de messages qui se réinitialise chaque jour.

À utiliser pour :

rédaction et recherche sans script ;
analyse d’images sans API ;
comparaison avec d’autres modèles de chat gratuits.

À éviter pour :

une intégration logicielle ;
le traitement par lots ;
tout flux nécessitant une réponse programmable.

Voie 2 : Google AI Studio, l’aire de jeux navigateur

Google AI Studio est l’interface web pour prototyper avec Flash avant d’écrire du code.

Ouvrez aistudio.google.com
Connectez-vous
Cliquez sur Créer une nouvelle invite ou choisissez un modèle
Sélectionnez gemini-3.5-flash
Saisissez votre invite, puis cliquez sur Exécuter

AI Studio permet de tester rapidement :

température, top-K, top-P ;
instructions système ;
sortie structurée en JSON ;
invites multimodales avec plusieurs images ;
génération de code Python ou Node.js équivalent ;
export vers un appel d’API Flash.

AI Studio ne facture pas l’usage depuis le navigateur. C’est le meilleur point de départ pour valider vos invites avant une intégration API.

Voie 3 : Clé API gratuite Gemini 3.5 Flash

C’est la voie la plus utile pour les développeurs. Le même compte AI Studio peut générer une clé API gratuite compatible avec gemini-3.5-flash.

Obtenir la clé

Dans AI Studio, cliquez sur Obtenir une clé API
Choisissez ou créez un projet
Cliquez sur Créer une clé API
Copiez la clé et stockez-la dans un endroit sûr

Aucune carte de crédit n’est requise. La clé fonctionne immédiatement avec Flash. Pour le détail étape par étape, consultez le guide de la clé API Gemini gratuite.

Quotas du niveau gratuit

En mai 2026, le niveau gratuit pour gemini-3.5-flash est approximativement :

1 500 requêtes par jour
1 million de tokens par minute
15 requêtes par minute

Ces limites peuvent changer. Vérifiez toujours la page des tarifs Google avant de baser une application de production dessus. Pour le calcul détaillé des coûts au-delà du gratuit, consultez la répartition des tarifs Flash.

Tester la clé avec Python

import os
from google import genai

client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Give me three startup ideas for API tooling in 2026."
)

print(response.text)

Tester la clé avec Node.js

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({
  apiKey: process.env.GEMINI_API_KEY,
});

const response = await ai.models.generateContent({
  model: "gemini-3.5-flash",
  contents: "Give me three startup ideas for API tooling in 2026.",
});

console.log(response.text);

Tester la clé avec curl

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [
      {
        "parts": [
          {
            "text": "Hello Gemini 3.5 Flash"
          }
        ]
      }
    ]
  }'

Pour une configuration plus complète, incluant streaming et appels d’outils, consultez le guide de l’API Gemini 3.5 Flash.

Tester les requêtes Flash dans Apidog

Si vous avez 1 500 requêtes gratuites par jour, évitez de les gaspiller en relançant manuellement des appels mal formés. Apidog permet d’enregistrer votre endpoint Flash, de stocker la clé comme variable d’environnement et de rejouer les requêtes sans réécrire curl.

Flux recommandé :

Téléchargez Apidog
Créez une requête et collez le curl ci-dessus
Déplacez la clé API dans les variables d’environnement
Enregistrez la requête
Ajoutez des assertions sur la réponse
Rejouez-la après chaque modification d’invite

L’intérêt : vous gardez un historique des réponses et vous réduisez les appels inutiles pendant le débogage.

Voie 4 : Crédits Vertex AI pour nouveau compte Google Cloud

Si vous créez un nouveau compte Google Cloud, vous pouvez obtenir 300 $ de crédits valables 90 jours. Ces crédits couvrent Gemini 3.5 Flash via Vertex AI, avec des contrôles plus adaptés aux organisations.

Étapes :

Inscrivez-vous sur cloud.google.com
Confirmez le crédit de 300 $
Activez l’API Vertex AI
Créez un compte de service
Donnez-lui le rôle aiplatform.user
Téléchargez les identifiants JSON
Appelez Flash via le SDK Vertex AI

Exemple Python :

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(
    project="your-project-id",
    location="us-central1"
)

model = GenerativeModel("gemini-3.5-flash")
response = model.generate_content("Explain CAP theorem.")

print(response.text)

Vertex AI n’utilise pas le même plafond de requêtes par jour que le niveau gratuit d’AI Studio. Vous êtes limité par le crédit en dollars. Au tarif indicatif d’environ 1,50 $ / 9 $ par million de tokens, 300 $ peuvent couvrir plusieurs semaines d’usage modéré.

Points à surveiller :

le crédit expire après 90 jours ;
le crédit inutilisé est perdu ;
désactivez la conversion automatique vers un compte payant si vous ne voulez pas de facturation surprise ;
Vertex demande plus de configuration qu’AI Studio.

Voie 5 : CLI Gemini depuis le terminal

La CLI Gemini est le client terminal open source de Google. Elle s’authentifie avec votre compte Google et donne accès à un quota quotidien de 1 000 requêtes sur le niveau gratuit, sans clé API.

Installation :

npm install -g @google/gemini-cli

Lancement :

gemini

Dans la CLI, choisissez ensuite gemini-3.5-flash.

Cette voie convient bien pour :

scripts ponctuels ;
résumé de fichiers ou de bases de code ;
usage terminal sans manipuler de clé API ;
quota séparé de celui de votre clé API.

Elle est aussi une alternative gratuite à Claude Code pour certains workflows de développement, car elle peut lire des fichiers et exécuter des outils.

Évitez-la pour :

intégrations de production ;
contrôle HTTP bas niveau ;
workloads nécessitant un streaming API spécifique.

Voie 6 bonus : OpenRouter et passerelles tierces

Certaines passerelles agrègent plusieurs modèles d’IA et proposent un accès gratuit ou quasi gratuit à Flash. Ce modèle est détaillé dans l’article Obtenir une API Gemini gratuite illimitée.

À garder en tête :

la qualité varie ;
certaines passerelles ralentissent fortement les appels ;
vos prompts transitent par un tiers ;
n’envoyez pas de données sensibles ;
certaines plateformes utilisent des moyens de paiement ou contournements non standards.

Considérez cette option comme une solution de secours, pas comme une architecture principale. Pour construire sérieusement, privilégiez AI Studio ou Vertex AI.

Quelle voie choisir ?

Utilisez ce raccourci :

Vous voulez discuter ? Application Gemini
Vous voulez travailler vos prompts ? AI Studio
Vous construisez une application ? Clé API AI Studio
Vous voulez un quota plus large avec un compte GCP neuf ? Vertex AI
Vous préférez le terminal ? CLI Gemini
Vous acceptez les risques tiers ? OpenRouter ou passerelles similaires

Dans la pratique, beaucoup de développeurs combinent deux voies : clé AI Studio pour le développement quotidien, crédits Vertex AI pour des tests plus proches de la production.

Flash gratuit vs payant : quand passer au payant

Le niveau gratuit suffit à beaucoup de projets secondaires. Passez au payant si :

Vous atteignez 1 500 requêtes/jour plusieurs jours de suite.

Le temps passé à contourner les quotas coûtera plus cher que le passage au payant.
Vous avez besoin d’un débit plus élevé.

Le niveau gratuit est limité à 15 requêtes/minute.
Vous avez besoin de résidence des données ou de journaux d’audit.

Dans ce cas, utilisez Vertex AI avec un compte facturé.

Pour estimer le coût réel par token, les remises batch et différents scénarios d’usage, consultez le guide des tarifs Gemini 3.5 Flash.

Comparez aussi avec d’autres fournisseurs. GPT-5.5 et Claude Opus 4.7 ont leurs propres accès gratuits et limites. La comparaison Gemini 3.5 vs GPT-5.5 vs Opus 4.7 aide à choisir selon le workload.

Conseils pour économiser le quota gratuit

Quelques habitudes simples permettent de faire durer les 1 500 requêtes/jour :

Cachez les réponses idempotentes. Une même entrée ne doit pas appeler l’API plusieurs fois.
Utilisez le mode batch pour le volume. Le mode batch de l’API Gemini offre une réduction de 50 % sur les tâches non temps réel et utilise un quota séparé.
Forcez une sortie structurée. Un schéma JSON évite plusieurs appels de parsing ou de correction.
Pré-validez les entrées. Les assertions dans Apidog détectent les requêtes mal formées avant de consommer du quota.
Utilisez Flash par défaut. Quand Pro sera disponible, gardez-le pour les tâches qui justifient ses quotas plus stricts.

FAQ

Gemini 3.5 Flash est-il vraiment gratuit ?

Oui, avec des plafonds. L’application Gemini, AI Studio et la clé API AI Studio donnent un accès gratuit à Flash avec des quotas quotidiens.

Faut-il une carte de crédit pour obtenir une clé API gratuite ?

Non. Le niveau gratuit d’AI Studio ne demande pas de carte. Vertex AI demande une carte pour activer le crédit de 300 $, mais la facturation dépend de la mise à niveau.

Peut-on utiliser la clé gratuite en production ?

Techniquement oui, mais le plafond de 1 500 requêtes/jour peut être vite atteint. Pour une vraie production, utilisez un compte facturé ou Vertex AI.

Gemini 3.5 Pro sera-t-il aussi gratuit ?

Google a historiquement proposé un accès gratuit aux modèles Pro en disponibilité générale. Pro devrait arriver dans AI Studio avec des quotas plus stricts.

Peut-on utiliser Flash gratuit dans Cursor ou VS Code ?

Oui, si l’outil accepte des clés API personnalisées. Le principe est le même que dans le tutoriel Gemini 3.0 Pro avec Cursor : remplacez simplement le modèle par gemini-3.5-flash.

Existe-t-il des journaux d’utilisation ?

Oui. Dans AI Studio, ouvrez votre projet et consultez l’onglet Activité.

Quel est le piège ?

Deux points :

Le niveau gratuit peut utiliser vos prompts pour améliorer les modèles Google, avec une option de désactivation dans les paramètres d’AI Studio.
Les limites du niveau gratuit peuvent changer sans préavis.

Projet de démarrage : résumer une URL avec Flash

Pour valider le flux complet, construisez une petite API qui reçoit une URL, récupère la page et demande à Flash de la résumer.

Exemple minimal :

import os
import requests
from google import genai

client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])

def summarize_url(url):
    html = requests.get(url).text

    response = client.models.generate_content(
        model="gemini-3.5-flash",
        contents=f"Summarize this webpage in 3 bullets:\n\n{html[:50000]}"
    )

    return response.text

print(summarize_url("https://blog.google/"))

Connectez ensuite cette API dans Apidog pour tester la requête et la réponse, puis déployez-la sur Cloud Run ou votre plateforme d’hébergement. Si ce flux fonctionne, vous maîtrisez le parcours Flash gratuit de bout en bout.

DEV Community