DEV Community

Cover image for Cómo Instalar y Usar Firecrawl CLI
Roobia
Roobia

Posted on • Originally published at apidog.com

Cómo Instalar y Usar Firecrawl CLI

Firecrawl CLI es una herramienta de terminal unificada para desarrolladores y agentes de IA que permite raspar, buscar, mapear, rastrear y automatizar navegadores en cualquier sitio web. Genera salidas en markdown limpio, JSON estructurado, capturas de pantalla y más, directamente en tu sistema de archivos. Ejecuta Firecrawl CLI con npx firecrawl (sin instalación previa) o instálalo globalmente. Integra fácilmente con Claude Code, Cursor u OpenCode usando firecrawl init para habilitar la funcionalidad en un solo comando.

Prueba Apidog hoy

💡Antes de ejecutar tu primer comando de Firecrawl CLI, obtén Apidog gratis. Te permite probar y depurar visualmente los endpoints de la API de Firecrawl que Firecrawl CLI usa internamente: claves de API, parámetros personalizados, formatos de respuesta, todo en una interfaz visual y limpia. Ahorra tiempo en la configuración y solución de problemas de integraciones de agentes.


Preparar el entorno antes de instalar Firecrawl CLI

  1. Verifica Node.js ≥18:
   node --version
Enter fullscreen mode Exit fullscreen mode

Si es necesario, actualiza Node.js usando tu gestor de paquetes o nvm.

  1. Organiza tus proyectos:
   mkdir firecrawl-cli-projects && cd firecrawl-cli-projects
Enter fullscreen mode Exit fullscreen mode

Esto facilita el manejo y versionado de datasets. Opcionalmente, desactiva telemetría:

   export FIRECRAWL_NO_TELEMETRY=1
Enter fullscreen mode Exit fullscreen mode

Instalación de Firecrawl CLI

Método recomendado para agentes

Instala, autentica y agrega skills para agentes en un solo paso:

npx -y firecrawl-cli@latest init --all --browser
Enter fullscreen mode Exit fullscreen mode

Esto abrirá tu navegador para iniciar sesión o registrarte, generará y almacenará tu API Key de forma segura y configurará la integración con Claude Code, Cursor y otros agentes. Reinicia el agente para detectar las nuevas capacidades.

Instalación global con npm

Para uso frecuente y acceso instantáneo:

npm install -g firecrawl-cli
firecrawl --version
Enter fullscreen mode Exit fullscreen mode

Autenticación y configuración

  1. Autentica tu cuenta:
   firecrawl login
Enter fullscreen mode Exit fullscreen mode

Se abrirá OAuth en el navegador. También puedes setear la clave manualmente:

   export FIRECRAWL_API_KEY=fc-tu-clave-aqui
Enter fullscreen mode Exit fullscreen mode
  1. Verifica el estado y configuración:
   firecrawl --status
   firecrawl view-config
Enter fullscreen mode Exit fullscreen mode

Cambia de cuenta con firecrawl logout y vuelve a iniciar sesión si es necesario. Para instancias autohospedadas:

   firecrawl --api-url http://localhost:3002
Enter fullscreen mode Exit fullscreen mode

Uso práctico: Comandos principales de Firecrawl CLI

Scraping de contenido

Extrae el contenido principal de cualquier URL:

firecrawl scrape https://example.com --only-main-content
Enter fullscreen mode Exit fullscreen mode

Guarda el resultado en un archivo:

firecrawl scrape https://example.com --only-main-content -o output.md
Enter fullscreen mode Exit fullscreen mode

Solicita múltiples formatos:

firecrawl scrape https://example.com --format markdown,json,html,links,images --pretty
Enter fullscreen mode Exit fullscreen mode

Opciones clave:

  • Captura de pantalla: --screenshot o --full-page-screenshot
  • Espera para sitios lentos: --wait-for 5000
  • Inclusión/exclusión precisa de etiquetas:
  firecrawl scrape https://docs.example.com --include-tags main,article --exclude-tags nav,footer,script
Enter fullscreen mode Exit fullscreen mode
  • Añade --timing para analizar tiempos de ejecución.

Búsqueda web automatizada

Raspa los mejores resultados de búsqueda web:

firecrawl search "últimos benchmarks de agentes de IA" --scrape --limit 8 --scrape-formats markdown
Enter fullscreen mode Exit fullscreen mode

Filtra por antigüedad (--tbs qdr:w), ubicación o tipo de fuente. Complementa con sesiones de navegador para inspección avanzada.


Mapeo de sitios web

Descubre todas las URLs de un sitio antes de un scraping profundo:

firecrawl map https://example.com -o sitemap.json
Enter fullscreen mode Exit fullscreen mode

Obtendrás un JSON estructurado, útil para alimentar a los comandos de scraping o crawling. Firecrawl CLI respeta robots.txt automáticamente.


Rastreo recursivo de sitios completos

Rastrea exhaustivamente sitios web:

firecrawl crawl https://example.com --wait --progress -o crawl-output.json
Enter fullscreen mode Exit fullscreen mode

Controla profundidad, máxima cantidad de páginas y concurrencia para optimizar recursos. Usa el progreso en tiempo real para monitorear o cancelar tareas grandes.


Automatización de sesiones de navegador

Gestiona flujos interactivos con navegadores en la nube:

firecrawl browser launch-session
Enter fullscreen mode Exit fullscreen mode

Obtén el ID de sesión y ejecuta acciones secuenciales:

firecrawl browser execute "open https://news.ycombinator.com" --session <id>
firecrawl browser execute "click .titleline > a" --session <id>
firecrawl browser execute "scrape" --session <id>
Enter fullscreen mode Exit fullscreen mode

Admite clics, escritura, navegación y extracción post-interacción. Cierra sesiones para liberar recursos.


Flags globales y configuración avanzada

Configura Firecrawl CLI de forma persistente:

firecrawl config --api-url https://tu-endpoint-personalizado --concurrency 5
Enter fullscreen mode Exit fullscreen mode
  • Establece salida JSON globalmente.
  • Ajusta headers personalizados.
  • Monitorea créditos con --status.
  • Exporta tu API key en el perfil de tu shell para sesiones continuas.

Integración con agentes de IA

Instala la habilidad una vez:

npx -y firecrawl-cli@latest init --all
Enter fullscreen mode Exit fullscreen mode

Los agentes detectarán Firecrawl CLI automáticamente. En modo CLI + Skills, los agentes ejecutan comandos explícitamente. En modo MCP, las herramientas nativas se llaman de forma transparente.

Firecrawl CLI devuelve rutas de archivos en vez de contenido bruto, optimizando el uso de ventanas de contexto ligeras para los agentes.


Resolución eficiente de problemas

  • ¿Problemas de autenticación? Repite firecrawl login.
  • ¿Límites de velocidad? Reduce la concurrencia o revisa tu panel de control.
  • ¿Resultados vacíos en sitios con JS pesado? Aumenta --wait-for o activa --only-main-content.
  • Usa --timing para diagnósticos.
  • Cambia claves con firecrawl logout.

Mejores prácticas para Firecrawl CLI

  • Incluye siempre --only-main-content para salidas limpias.
  • Usa nombres de archivo descriptivos y carpetas dedicadas.
  • Prueba primero en pequeño antes de rastreos completos.
  • Encadena búsqueda → mapeo → rastreo.
  • Versiona tus directorios de salida para datasets reproducibles.
  • Monitorea el uso de créditos semanalmente.

Complementa tu flujo con Apidog

Descarga Apidog gratis e importa los endpoints de Firecrawl (scrape, search, crawl, etc.) en colecciones. Apidog visualiza solicitudes, administra tu API key como variable, simula respuestas y ejecuta pruebas automatizadas. Así, puedes depurar y validar cargas útiles complejas antes de correrlas en terminal. Firecrawl CLI + Apidog brindan confianza de extremo a extremo: datos web actuales y comportamiento de API verificado.


Conclusión

Ahora tienes el control de cada aspecto de Firecrawl CLI: instalación, autenticación, scraping avanzado, búsqueda, mapeo, rastreo y automatización de navegador. Firecrawl CLI convierte el acceso web en una tubería limpia y optimizada desde la terminal, ideal para agentes y desarrolladores.

Ejecuta el comando init, prueba tu primer scraping e itera desde ahí. El uso inteligente de flags y la experimentación te ofrecen resultados superiores.

Descarga Apidog gratis para potenciar tus pruebas y validaciones de API con Firecrawl CLI. ¡Instala Firecrawl CLI, experimenta y domina el scraping web en tiempo real!

Recursos adicionales

Top comments (0)