Gemini 3.5 Flash a été lancé le 19 mai 2026, et Google a conservé un niveau d’accès gratuit. Flash est disponible dès maintenant avec une clé API gratuite ; Pro arrive en juin. Si vous voulez utiliser Flash sans payer, voici les voies réellement exploitables côté développeur.
Ce guide se concentre sur la mise en place pratique : obtenir une clé, tester des appels API, comprendre les quotas et choisir le bon chemin selon votre usage.
Résumé rapide
| Voie | Ce que vous obtenez | Limite |
|---|---|---|
| Application Gemini | Chat complet + saisie d’images avec Flash | Plafond quotidien de messages sur le niveau gratuit |
| Google AI Studio | Aire de jeux web avec contrôle des paramètres | Pas de quota strict dans l’interface |
| Clé API AI Studio | Accès REST/SDK à gemini-3.5-flash
|
~1 500 requêtes/jour |
| Crédits nouveau compte Vertex AI | Accès Flash orienté production | 300 $ de crédit, 90 jours |
| CLI Gemini | Accès terminal à Flash via connexion Google | 1 000 requêtes quotidiennes |
Chaque voie répond à un besoin différent : discuter, prototyper une invite, intégrer Flash dans une application ou exécuter des scripts.
Voie 1 : Application Gemini, sans configuration
Utilisez cette voie si vous voulez simplement tester Flash dans une interface de chat.
- Ouvrez gemini.google.com
- Connectez-vous avec un compte Google
- Dans le sélecteur de modèle, choisissez 3.5 Flash
- Lancez une conversation
L’application prend en charge le texte, les images, les fichiers et l’édition de documents de type Canvas. Sur le niveau gratuit, vous disposez d’un plafond quotidien de messages qui se réinitialise chaque jour.
À utiliser pour :
- rédaction et recherche sans script ;
- analyse d’images sans API ;
- comparaison avec d’autres modèles de chat gratuits.
À éviter pour :
- une intégration logicielle ;
- le traitement par lots ;
- tout flux nécessitant une réponse programmable.
Voie 2 : Google AI Studio, l’aire de jeux navigateur
Google AI Studio est l’interface web pour prototyper avec Flash avant d’écrire du code.
- Ouvrez aistudio.google.com
- Connectez-vous
- Cliquez sur Créer une nouvelle invite ou choisissez un modèle
- Sélectionnez
gemini-3.5-flash - Saisissez votre invite, puis cliquez sur Exécuter
AI Studio permet de tester rapidement :
- température, top-K, top-P ;
- instructions système ;
- sortie structurée en JSON ;
- invites multimodales avec plusieurs images ;
- génération de code Python ou Node.js équivalent ;
- export vers un appel d’API Flash.
AI Studio ne facture pas l’usage depuis le navigateur. C’est le meilleur point de départ pour valider vos invites avant une intégration API.
Voie 3 : Clé API gratuite Gemini 3.5 Flash
C’est la voie la plus utile pour les développeurs. Le même compte AI Studio peut générer une clé API gratuite compatible avec gemini-3.5-flash.
Obtenir la clé
- Dans AI Studio, cliquez sur Obtenir une clé API
- Choisissez ou créez un projet
- Cliquez sur Créer une clé API
- Copiez la clé et stockez-la dans un endroit sûr
Aucune carte de crédit n’est requise. La clé fonctionne immédiatement avec Flash. Pour le détail étape par étape, consultez le guide de la clé API Gemini gratuite.
Quotas du niveau gratuit
En mai 2026, le niveau gratuit pour gemini-3.5-flash est approximativement :
- 1 500 requêtes par jour
- 1 million de tokens par minute
- 15 requêtes par minute
Ces limites peuvent changer. Vérifiez toujours la page des tarifs Google avant de baser une application de production dessus. Pour le calcul détaillé des coûts au-delà du gratuit, consultez la répartition des tarifs Flash.
Tester la clé avec Python
import os
from google import genai
client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="Give me three startup ideas for API tooling in 2026."
)
print(response.text)
Tester la clé avec Node.js
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({
apiKey: process.env.GEMINI_API_KEY,
});
const response = await ai.models.generateContent({
model: "gemini-3.5-flash",
contents: "Give me three startup ideas for API tooling in 2026.",
});
console.log(response.text);
Tester la clé avec curl
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [
{
"parts": [
{
"text": "Hello Gemini 3.5 Flash"
}
]
}
]
}'
Pour une configuration plus complète, incluant streaming et appels d’outils, consultez le guide de l’API Gemini 3.5 Flash.
Tester les requêtes Flash dans Apidog
Si vous avez 1 500 requêtes gratuites par jour, évitez de les gaspiller en relançant manuellement des appels mal formés. Apidog permet d’enregistrer votre endpoint Flash, de stocker la clé comme variable d’environnement et de rejouer les requêtes sans réécrire curl.
Flux recommandé :
- Téléchargez Apidog
- Créez une requête et collez le
curlci-dessus - Déplacez la clé API dans les variables d’environnement
- Enregistrez la requête
- Ajoutez des assertions sur la réponse
- Rejouez-la après chaque modification d’invite
L’intérêt : vous gardez un historique des réponses et vous réduisez les appels inutiles pendant le débogage.
Voie 4 : Crédits Vertex AI pour nouveau compte Google Cloud
Si vous créez un nouveau compte Google Cloud, vous pouvez obtenir 300 $ de crédits valables 90 jours. Ces crédits couvrent Gemini 3.5 Flash via Vertex AI, avec des contrôles plus adaptés aux organisations.
Étapes :
- Inscrivez-vous sur cloud.google.com
- Confirmez le crédit de 300 $
- Activez l’API Vertex AI
- Créez un compte de service
- Donnez-lui le rôle
aiplatform.user - Téléchargez les identifiants JSON
- Appelez Flash via le SDK Vertex AI
Exemple Python :
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(
project="your-project-id",
location="us-central1"
)
model = GenerativeModel("gemini-3.5-flash")
response = model.generate_content("Explain CAP theorem.")
print(response.text)
Vertex AI n’utilise pas le même plafond de requêtes par jour que le niveau gratuit d’AI Studio. Vous êtes limité par le crédit en dollars. Au tarif indicatif d’environ 1,50 $ / 9 $ par million de tokens, 300 $ peuvent couvrir plusieurs semaines d’usage modéré.
Points à surveiller :
- le crédit expire après 90 jours ;
- le crédit inutilisé est perdu ;
- désactivez la conversion automatique vers un compte payant si vous ne voulez pas de facturation surprise ;
- Vertex demande plus de configuration qu’AI Studio.
Voie 5 : CLI Gemini depuis le terminal
La CLI Gemini est le client terminal open source de Google. Elle s’authentifie avec votre compte Google et donne accès à un quota quotidien de 1 000 requêtes sur le niveau gratuit, sans clé API.
Installation :
npm install -g @google/gemini-cli
Lancement :
gemini
Dans la CLI, choisissez ensuite gemini-3.5-flash.
Cette voie convient bien pour :
- scripts ponctuels ;
- résumé de fichiers ou de bases de code ;
- usage terminal sans manipuler de clé API ;
- quota séparé de celui de votre clé API.
Elle est aussi une alternative gratuite à Claude Code pour certains workflows de développement, car elle peut lire des fichiers et exécuter des outils.
Évitez-la pour :
- intégrations de production ;
- contrôle HTTP bas niveau ;
- workloads nécessitant un streaming API spécifique.
Voie 6 bonus : OpenRouter et passerelles tierces
Certaines passerelles agrègent plusieurs modèles d’IA et proposent un accès gratuit ou quasi gratuit à Flash. Ce modèle est détaillé dans l’article Obtenir une API Gemini gratuite illimitée.
À garder en tête :
- la qualité varie ;
- certaines passerelles ralentissent fortement les appels ;
- vos prompts transitent par un tiers ;
- n’envoyez pas de données sensibles ;
- certaines plateformes utilisent des moyens de paiement ou contournements non standards.
Considérez cette option comme une solution de secours, pas comme une architecture principale. Pour construire sérieusement, privilégiez AI Studio ou Vertex AI.
Quelle voie choisir ?
Utilisez ce raccourci :
- Vous voulez discuter ? Application Gemini
- Vous voulez travailler vos prompts ? AI Studio
- Vous construisez une application ? Clé API AI Studio
- Vous voulez un quota plus large avec un compte GCP neuf ? Vertex AI
- Vous préférez le terminal ? CLI Gemini
- Vous acceptez les risques tiers ? OpenRouter ou passerelles similaires
Dans la pratique, beaucoup de développeurs combinent deux voies : clé AI Studio pour le développement quotidien, crédits Vertex AI pour des tests plus proches de la production.
Flash gratuit vs payant : quand passer au payant
Le niveau gratuit suffit à beaucoup de projets secondaires. Passez au payant si :
Vous atteignez 1 500 requêtes/jour plusieurs jours de suite.
Le temps passé à contourner les quotas coûtera plus cher que le passage au payant.Vous avez besoin d’un débit plus élevé.
Le niveau gratuit est limité à 15 requêtes/minute.Vous avez besoin de résidence des données ou de journaux d’audit.
Dans ce cas, utilisez Vertex AI avec un compte facturé.
Pour estimer le coût réel par token, les remises batch et différents scénarios d’usage, consultez le guide des tarifs Gemini 3.5 Flash.
Comparez aussi avec d’autres fournisseurs. GPT-5.5 et Claude Opus 4.7 ont leurs propres accès gratuits et limites. La comparaison Gemini 3.5 vs GPT-5.5 vs Opus 4.7 aide à choisir selon le workload.
Conseils pour économiser le quota gratuit
Quelques habitudes simples permettent de faire durer les 1 500 requêtes/jour :
- Cachez les réponses idempotentes. Une même entrée ne doit pas appeler l’API plusieurs fois.
- Utilisez le mode batch pour le volume. Le mode batch de l’API Gemini offre une réduction de 50 % sur les tâches non temps réel et utilise un quota séparé.
- Forcez une sortie structurée. Un schéma JSON évite plusieurs appels de parsing ou de correction.
- Pré-validez les entrées. Les assertions dans Apidog détectent les requêtes mal formées avant de consommer du quota.
- Utilisez Flash par défaut. Quand Pro sera disponible, gardez-le pour les tâches qui justifient ses quotas plus stricts.
FAQ
Gemini 3.5 Flash est-il vraiment gratuit ?
Oui, avec des plafonds. L’application Gemini, AI Studio et la clé API AI Studio donnent un accès gratuit à Flash avec des quotas quotidiens.
Faut-il une carte de crédit pour obtenir une clé API gratuite ?
Non. Le niveau gratuit d’AI Studio ne demande pas de carte. Vertex AI demande une carte pour activer le crédit de 300 $, mais la facturation dépend de la mise à niveau.
Peut-on utiliser la clé gratuite en production ?
Techniquement oui, mais le plafond de 1 500 requêtes/jour peut être vite atteint. Pour une vraie production, utilisez un compte facturé ou Vertex AI.
Gemini 3.5 Pro sera-t-il aussi gratuit ?
Google a historiquement proposé un accès gratuit aux modèles Pro en disponibilité générale. Pro devrait arriver dans AI Studio avec des quotas plus stricts.
Peut-on utiliser Flash gratuit dans Cursor ou VS Code ?
Oui, si l’outil accepte des clés API personnalisées. Le principe est le même que dans le tutoriel Gemini 3.0 Pro avec Cursor : remplacez simplement le modèle par gemini-3.5-flash.
Existe-t-il des journaux d’utilisation ?
Oui. Dans AI Studio, ouvrez votre projet et consultez l’onglet Activité.
Quel est le piège ?
Deux points :
- Le niveau gratuit peut utiliser vos prompts pour améliorer les modèles Google, avec une option de désactivation dans les paramètres d’AI Studio.
- Les limites du niveau gratuit peuvent changer sans préavis.
Projet de démarrage : résumer une URL avec Flash
Pour valider le flux complet, construisez une petite API qui reçoit une URL, récupère la page et demande à Flash de la résumer.
Exemple minimal :
import os
import requests
from google import genai
client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])
def summarize_url(url):
html = requests.get(url).text
response = client.models.generate_content(
model="gemini-3.5-flash",
contents=f"Summarize this webpage in 3 bullets:\n\n{html[:50000]}"
)
return response.text
print(summarize_url("https://blog.google/"))
Connectez ensuite cette API dans Apidog pour tester la requête et la réponse, puis déployez-la sur Cloud Run ou votre plateforme d’hébergement. Si ce flux fonctionne, vous maîtrisez le parcours Flash gratuit de bout en bout.





Top comments (0)