DEV Community

Cover image for Comment utiliser Gemini 3.5 Flash gratuitement ?
Antoine Laurent
Antoine Laurent

Posted on • Originally published at apidog.com

Comment utiliser Gemini 3.5 Flash gratuitement ?

Gemini 3.5 Flash a été lancé le 19 mai 2026, et Google a conservé un niveau d’accès gratuit. Flash est disponible dès maintenant avec une clé API gratuite ; Pro arrive en juin. Si vous voulez utiliser Flash sans payer, voici les voies réellement exploitables côté développeur.

Essayez Apidog aujourd’hui

Ce guide se concentre sur la mise en place pratique : obtenir une clé, tester des appels API, comprendre les quotas et choisir le bon chemin selon votre usage.

Gemini 3.5 Flash

Résumé rapide

Voie Ce que vous obtenez Limite
Application Gemini Chat complet + saisie d’images avec Flash Plafond quotidien de messages sur le niveau gratuit
Google AI Studio Aire de jeux web avec contrôle des paramètres Pas de quota strict dans l’interface
Clé API AI Studio Accès REST/SDK à gemini-3.5-flash ~1 500 requêtes/jour
Crédits nouveau compte Vertex AI Accès Flash orienté production 300 $ de crédit, 90 jours
CLI Gemini Accès terminal à Flash via connexion Google 1 000 requêtes quotidiennes

Chaque voie répond à un besoin différent : discuter, prototyper une invite, intégrer Flash dans une application ou exécuter des scripts.

Voie 1 : Application Gemini, sans configuration

Utilisez cette voie si vous voulez simplement tester Flash dans une interface de chat.

  1. Ouvrez gemini.google.com
  2. Connectez-vous avec un compte Google
  3. Dans le sélecteur de modèle, choisissez 3.5 Flash
  4. Lancez une conversation

Application Gemini

L’application prend en charge le texte, les images, les fichiers et l’édition de documents de type Canvas. Sur le niveau gratuit, vous disposez d’un plafond quotidien de messages qui se réinitialise chaque jour.

À utiliser pour :

À éviter pour :

  • une intégration logicielle ;
  • le traitement par lots ;
  • tout flux nécessitant une réponse programmable.

Voie 2 : Google AI Studio, l’aire de jeux navigateur

Google AI Studio est l’interface web pour prototyper avec Flash avant d’écrire du code.

  1. Ouvrez aistudio.google.com
  2. Connectez-vous
  3. Cliquez sur Créer une nouvelle invite ou choisissez un modèle
  4. Sélectionnez gemini-3.5-flash
  5. Saisissez votre invite, puis cliquez sur Exécuter

Google AI Studio

AI Studio permet de tester rapidement :

  • température, top-K, top-P ;
  • instructions système ;
  • sortie structurée en JSON ;
  • invites multimodales avec plusieurs images ;
  • génération de code Python ou Node.js équivalent ;
  • export vers un appel d’API Flash.

AI Studio ne facture pas l’usage depuis le navigateur. C’est le meilleur point de départ pour valider vos invites avant une intégration API.

Voie 3 : Clé API gratuite Gemini 3.5 Flash

C’est la voie la plus utile pour les développeurs. Le même compte AI Studio peut générer une clé API gratuite compatible avec gemini-3.5-flash.

Obtenir la clé

  1. Dans AI Studio, cliquez sur Obtenir une clé API
  2. Choisissez ou créez un projet
  3. Cliquez sur Créer une clé API
  4. Copiez la clé et stockez-la dans un endroit sûr

Clé API Gemini

Aucune carte de crédit n’est requise. La clé fonctionne immédiatement avec Flash. Pour le détail étape par étape, consultez le guide de la clé API Gemini gratuite.

Quotas du niveau gratuit

En mai 2026, le niveau gratuit pour gemini-3.5-flash est approximativement :

  • 1 500 requêtes par jour
  • 1 million de tokens par minute
  • 15 requêtes par minute

Ces limites peuvent changer. Vérifiez toujours la page des tarifs Google avant de baser une application de production dessus. Pour le calcul détaillé des coûts au-delà du gratuit, consultez la répartition des tarifs Flash.

Tester la clé avec Python

import os
from google import genai

client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Give me three startup ideas for API tooling in 2026."
)

print(response.text)
Enter fullscreen mode Exit fullscreen mode

Tester la clé avec Node.js

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({
  apiKey: process.env.GEMINI_API_KEY,
});

const response = await ai.models.generateContent({
  model: "gemini-3.5-flash",
  contents: "Give me three startup ideas for API tooling in 2026.",
});

console.log(response.text);
Enter fullscreen mode Exit fullscreen mode

Tester la clé avec curl

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [
      {
        "parts": [
          {
            "text": "Hello Gemini 3.5 Flash"
          }
        ]
      }
    ]
  }'
Enter fullscreen mode Exit fullscreen mode

Pour une configuration plus complète, incluant streaming et appels d’outils, consultez le guide de l’API Gemini 3.5 Flash.

Tester les requêtes Flash dans Apidog

Si vous avez 1 500 requêtes gratuites par jour, évitez de les gaspiller en relançant manuellement des appels mal formés. Apidog permet d’enregistrer votre endpoint Flash, de stocker la clé comme variable d’environnement et de rejouer les requêtes sans réécrire curl.

Tester Gemini dans Apidog

Flux recommandé :

  1. Téléchargez Apidog
  2. Créez une requête et collez le curl ci-dessus
  3. Déplacez la clé API dans les variables d’environnement
  4. Enregistrez la requête
  5. Ajoutez des assertions sur la réponse
  6. Rejouez-la après chaque modification d’invite

L’intérêt : vous gardez un historique des réponses et vous réduisez les appels inutiles pendant le débogage.

Voie 4 : Crédits Vertex AI pour nouveau compte Google Cloud

Si vous créez un nouveau compte Google Cloud, vous pouvez obtenir 300 $ de crédits valables 90 jours. Ces crédits couvrent Gemini 3.5 Flash via Vertex AI, avec des contrôles plus adaptés aux organisations.

Étapes :

  1. Inscrivez-vous sur cloud.google.com
  2. Confirmez le crédit de 300 $
  3. Activez l’API Vertex AI
  4. Créez un compte de service
  5. Donnez-lui le rôle aiplatform.user
  6. Téléchargez les identifiants JSON
  7. Appelez Flash via le SDK Vertex AI

Exemple Python :

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(
    project="your-project-id",
    location="us-central1"
)

model = GenerativeModel("gemini-3.5-flash")
response = model.generate_content("Explain CAP theorem.")

print(response.text)
Enter fullscreen mode Exit fullscreen mode

Vertex AI n’utilise pas le même plafond de requêtes par jour que le niveau gratuit d’AI Studio. Vous êtes limité par le crédit en dollars. Au tarif indicatif d’environ 1,50 $ / 9 $ par million de tokens, 300 $ peuvent couvrir plusieurs semaines d’usage modéré.

Points à surveiller :

  • le crédit expire après 90 jours ;
  • le crédit inutilisé est perdu ;
  • désactivez la conversion automatique vers un compte payant si vous ne voulez pas de facturation surprise ;
  • Vertex demande plus de configuration qu’AI Studio.

Voie 5 : CLI Gemini depuis le terminal

La CLI Gemini est le client terminal open source de Google. Elle s’authentifie avec votre compte Google et donne accès à un quota quotidien de 1 000 requêtes sur le niveau gratuit, sans clé API.

Installation :

npm install -g @google/gemini-cli
Enter fullscreen mode Exit fullscreen mode

Lancement :

gemini
Enter fullscreen mode Exit fullscreen mode

Dans la CLI, choisissez ensuite gemini-3.5-flash.

Cette voie convient bien pour :

  • scripts ponctuels ;
  • résumé de fichiers ou de bases de code ;
  • usage terminal sans manipuler de clé API ;
  • quota séparé de celui de votre clé API.

Elle est aussi une alternative gratuite à Claude Code pour certains workflows de développement, car elle peut lire des fichiers et exécuter des outils.

Évitez-la pour :

  • intégrations de production ;
  • contrôle HTTP bas niveau ;
  • workloads nécessitant un streaming API spécifique.

Voie 6 bonus : OpenRouter et passerelles tierces

Certaines passerelles agrègent plusieurs modèles d’IA et proposent un accès gratuit ou quasi gratuit à Flash. Ce modèle est détaillé dans l’article Obtenir une API Gemini gratuite illimitée.

À garder en tête :

  • la qualité varie ;
  • certaines passerelles ralentissent fortement les appels ;
  • vos prompts transitent par un tiers ;
  • n’envoyez pas de données sensibles ;
  • certaines plateformes utilisent des moyens de paiement ou contournements non standards.

Considérez cette option comme une solution de secours, pas comme une architecture principale. Pour construire sérieusement, privilégiez AI Studio ou Vertex AI.

Quelle voie choisir ?

Utilisez ce raccourci :

  • Vous voulez discuter ? Application Gemini
  • Vous voulez travailler vos prompts ? AI Studio
  • Vous construisez une application ? Clé API AI Studio
  • Vous voulez un quota plus large avec un compte GCP neuf ? Vertex AI
  • Vous préférez le terminal ? CLI Gemini
  • Vous acceptez les risques tiers ? OpenRouter ou passerelles similaires

Dans la pratique, beaucoup de développeurs combinent deux voies : clé AI Studio pour le développement quotidien, crédits Vertex AI pour des tests plus proches de la production.

Flash gratuit vs payant : quand passer au payant

Le niveau gratuit suffit à beaucoup de projets secondaires. Passez au payant si :

  1. Vous atteignez 1 500 requêtes/jour plusieurs jours de suite.

    Le temps passé à contourner les quotas coûtera plus cher que le passage au payant.

  2. Vous avez besoin d’un débit plus élevé.

    Le niveau gratuit est limité à 15 requêtes/minute.

  3. Vous avez besoin de résidence des données ou de journaux d’audit.

    Dans ce cas, utilisez Vertex AI avec un compte facturé.

Pour estimer le coût réel par token, les remises batch et différents scénarios d’usage, consultez le guide des tarifs Gemini 3.5 Flash.

Comparez aussi avec d’autres fournisseurs. GPT-5.5 et Claude Opus 4.7 ont leurs propres accès gratuits et limites. La comparaison Gemini 3.5 vs GPT-5.5 vs Opus 4.7 aide à choisir selon le workload.

Conseils pour économiser le quota gratuit

Quelques habitudes simples permettent de faire durer les 1 500 requêtes/jour :

  • Cachez les réponses idempotentes. Une même entrée ne doit pas appeler l’API plusieurs fois.
  • Utilisez le mode batch pour le volume. Le mode batch de l’API Gemini offre une réduction de 50 % sur les tâches non temps réel et utilise un quota séparé.
  • Forcez une sortie structurée. Un schéma JSON évite plusieurs appels de parsing ou de correction.
  • Pré-validez les entrées. Les assertions dans Apidog détectent les requêtes mal formées avant de consommer du quota.
  • Utilisez Flash par défaut. Quand Pro sera disponible, gardez-le pour les tâches qui justifient ses quotas plus stricts.

FAQ

Gemini 3.5 Flash est-il vraiment gratuit ?

Oui, avec des plafonds. L’application Gemini, AI Studio et la clé API AI Studio donnent un accès gratuit à Flash avec des quotas quotidiens.

Faut-il une carte de crédit pour obtenir une clé API gratuite ?

Non. Le niveau gratuit d’AI Studio ne demande pas de carte. Vertex AI demande une carte pour activer le crédit de 300 $, mais la facturation dépend de la mise à niveau.

Peut-on utiliser la clé gratuite en production ?

Techniquement oui, mais le plafond de 1 500 requêtes/jour peut être vite atteint. Pour une vraie production, utilisez un compte facturé ou Vertex AI.

Gemini 3.5 Pro sera-t-il aussi gratuit ?

Google a historiquement proposé un accès gratuit aux modèles Pro en disponibilité générale. Pro devrait arriver dans AI Studio avec des quotas plus stricts.

Peut-on utiliser Flash gratuit dans Cursor ou VS Code ?

Oui, si l’outil accepte des clés API personnalisées. Le principe est le même que dans le tutoriel Gemini 3.0 Pro avec Cursor : remplacez simplement le modèle par gemini-3.5-flash.

Existe-t-il des journaux d’utilisation ?

Oui. Dans AI Studio, ouvrez votre projet et consultez l’onglet Activité.

Quel est le piège ?

Deux points :

  1. Le niveau gratuit peut utiliser vos prompts pour améliorer les modèles Google, avec une option de désactivation dans les paramètres d’AI Studio.
  2. Les limites du niveau gratuit peuvent changer sans préavis.

Projet de démarrage : résumer une URL avec Flash

Pour valider le flux complet, construisez une petite API qui reçoit une URL, récupère la page et demande à Flash de la résumer.

Exemple minimal :

import os
import requests
from google import genai

client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])

def summarize_url(url):
    html = requests.get(url).text

    response = client.models.generate_content(
        model="gemini-3.5-flash",
        contents=f"Summarize this webpage in 3 bullets:\n\n{html[:50000]}"
    )

    return response.text

print(summarize_url("https://blog.google/"))
Enter fullscreen mode Exit fullscreen mode

Connectez ensuite cette API dans Apidog pour tester la requête et la réponse, puis déployez-la sur Cloud Run ou votre plateforme d’hébergement. Si ce flux fonctionne, vous maîtrisez le parcours Flash gratuit de bout en bout.

Top comments (0)