Antoine Laurent

Posted on Mar 17 • Originally published at apidog.com

Comment Installer et Utiliser Firecrawl CLI: Guide Complet

#automation #cli #tutorial #webscraping

Firecrawl CLI : Guide pratique pour automatiser le scraping, la recherche et l’exploration web

Firecrawl CLI est un outil terminal unifié pour les développeurs et agents IA permettant de scraper, rechercher, cartographier, explorer et automatiser la navigation sur n’importe quel site web. Il produit du markdown propre, du JSON, des captures d’écran et plus encore, directement sur votre système de fichiers. Firecrawl CLI s’exécute via npx firecrawl (aucune installation préalable) ou via une installation globale. Connectez-le à Claude Code, Cursor ou OpenCode en une seule commande firecrawl init pour ajouter automatiquement la compétence.

Essayez Apidog dès aujourd'hui

Firecrawl CLI est conçu pour fournir des données web fiables et en temps réel, sans scripts fragiles ni requêtes bloquées. Il unifie scraping, recherche web, cartographie de sites, exploration récursive et sessions de navigateur cloud en un seul outil natif pour le terminal. Firecrawl CLI génère du markdown propre, du JSON structuré, des captures d’écran ou du HTML, tout en maintenant une consommation de jetons faible et un contexte précis pour les LLM. Les agents comme Claude Code, Cursor et OpenCode exploitent Firecrawl CLI pour extraire du contenu à partir de pages JavaScript rendues, de sites dynamiques ou de flux protégés, là où les outils classiques échouent.

💡 Avant de lancer votre première commande Firecrawl CLI, récupérez gratuitement Apidog. Ce client vous permet de tester et déboguer visuellement les endpoints de l’API Firecrawl (utilisée en coulisses par Firecrawl CLI) : clés API, paramètres, formats de réponse, tout dans une interface claire. Vous gagnez un temps précieux lors de la configuration ou du dépannage de vos intégrations agents.

Préparation de l’environnement

Vérifiez que Node.js ≥18 est installé, car Firecrawl CLI dépend des fonctionnalités npm récentes :

node --version

Mettez à jour Node.js via votre gestionnaire de paquets ou nvm si besoin.

Créez un dossier de travail dédié pour organiser les sorties :

mkdir firecrawl-cli-projects && cd firecrawl-cli-projects

Cela évite l’encombrement et facilite la gestion via git. Pour désactiver la télémétrie :

export FIRECRAWL_NO_TELEMETRY=1

Installation rapide et intégration agent

Pour une installation, authentification et ajout des compétences agent en une seule étape :

npx -y firecrawl-cli@latest init --all --browser

Firecrawl CLI ouvre votre navigateur pour la connexion (ou création) de votre compte, génère et stocke votre clé API, puis configure automatiquement les compétences pour Claude Code, Cursor et autres agents compatibles. Redémarrez votre agent pour qu’il détecte les nouvelles capacités. Cette méthode équipe Firecrawl CLI globalement et autorise l’accès au navigateur MCP/serverless.

Installation globale (utilisation fréquente) :

npm install -g firecrawl-cli

Vérification :

firecrawl --version

Firecrawl CLI devient disponible instantanément depuis n’importe quel répertoire.

Authentification et configuration

Pour débloquer toutes les fonctionnalités :

firecrawl login

Firecrawl CLI lance une authentification OAuth via le navigateur. Pour définir la clé manuellement :

export FIRECRAWL_API_KEY=fc-your-key-here

Vérifiez le statut :

firecrawl --status

Voir la configuration complète :

firecrawl view-config

Changez de compte avec :

firecrawl logout

Pour les instances locales/self-hosted :

firecrawl --api-url http://localhost:3002

Commandes principales et meilleures pratiques

Scraper une page (extraction ciblée) :

firecrawl scrape https://example.com --only-main-content

Ajoutez -o output.md pour enregistrer le résultat. Le flag --only-main-content élimine navigation, pubs, sidebars et réduit l’usage des jetons.

Formats multiples :

firecrawl scrape https://example.com --format markdown,json,html,links,images --pretty

Captures d’écran :

firecrawl scrape https://example.com --screenshot
# ou page complète :
firecrawl scrape https://example.com --full-page-screenshot

Gérer les chargements lents :

firecrawl scrape https://example.com --wait-for 5000

Filtrer précisément par tags HTML :

firecrawl scrape https://docs.example.com --include-tags main,article --exclude-tags nav,footer,script

Ajouter --timing pour diagnostiquer les performances.

Recherche web automatisée :

firecrawl search "benchmarks agents IA récents" --scrape --limit 8 --scrape-formats markdown

Utilisez --tbs qdr:w pour filtrer par récence, options de localisation ou type de source.

Cartographie d’un site :

firecrawl map https://example.com -o sitemap.json

Firecrawl CLI génère une liste d’URLs structurée, à réutiliser dans des commandes scrape ou crawl.

Exploration récursive (crawl) :

firecrawl crawl https://example.com --wait --progress -o crawl-output.json

Contrôlez profondeur, nombre de pages, concurrence.

Automatisation de sessions navigateur :

firecrawl browser launch-session

Une fois l’ID de session obtenu, exécutez des actions :

firecrawl browser execute "open https://news.ycombinator.com" --session <id>
firecrawl browser execute "click .titleline > a" --session <id>
firecrawl browser execute "scrape" --session <id>

Firecrawl CLI prend en charge les clics, saisies, navigations, et extraction après interactions. Fermez les sessions pour libérer les ressources.

Configuration avancée :

firecrawl config --api-url https://your-custom-endpoint --concurrency 5

Forcez la sortie JSON ou ajustez les entêtes globalement. Exportez FIRECRAWL_API_KEY dans votre profil shell pour des sessions persistantes.

Intégration avec les agents IA

Installez la compétence Firecrawl CLI une fois :

npx -y firecrawl-cli@latest init --all

Les agents (Claude Code, Cursor, OpenCode, etc.) détectent automatiquement la compétence. Firecrawl CLI retourne des chemins de fichiers locaux pour préserver la fenêtre contextuelle.

Dépannage efficace

Authentification échouée : relancez firecrawl login.
Limites de débit : baissez la concurrence ou upgradez le plan via le dashboard.
Résultats vides sur sites JS : augmentez --wait-for ou activez --only-main-content.
Diagnostic : ajoutez --timing.
Changement de clé : firecrawl logout puis reconnectez-vous.

Bonnes pratiques

Ajoutez toujours --only-main-content pour des résultats propres.
Utilisez des noms de fichiers et dossiers explicites.
Testez d’abord sur une petite portion de site.
Enchaînez les étapes : recherche → cartographie → exploration.
Versionnez vos jeux de sorties.
Surveillez l'utilisation des crédits.

Compléter vos workflows avec Apidog

Téléchargez gratuitement Apidog et importez les endpoints Firecrawl (scrape, search, crawl, etc.) dans vos collections. Apidog visualise les requêtes, stocke la clé API comme variable, simule les réponses et permet des tests automatisés. Déboguez les options complexes ou les payloads personnalisés avant exécution dans le terminal. Firecrawl CLI + Apidog garantit des données web à jour et un comportement API vérifié.

Conclusion

Vous maîtrisez désormais toutes les étapes de Firecrawl CLI : installation, authentification, scraping avancé, recherche, cartographie, exploration et automatisation du navigateur. Firecrawl CLI convertit l’accès web en pipeline terminal propre et pilotable, au service des développeurs comme des agents IA.

Exécutez la commande init, testez un scraping, et construisez vos automatisations. Firecrawl CLI récompense l’expérimentation et l’utilisation fine des options.

Téléchargez Apidog gratuitement pour optimiser vos tests Firecrawl CLI et la validation API. Installez Firecrawl CLI, utilisez-le, et débloquez la maîtrise du web en temps réel.