Firecrawl CLI
Firecrawl CLIは、AIエージェントや開発者がウェブサイトからクリーンなMarkdown、JSON、スクリーンショットなどを直接ファイルシステムに書き込み、ウェブスクレイピングや自動化を高速化できる統合CLIツールです。npx firecrawl(インストール不要)またはグローバルインストール後にfirecrawl initコマンドを使えば、Claude CodeやCursor、OpenCodeへの連携もワンステップで完了します。
AIエージェントや開発者は、壊れやすいカスタムスクリプトやブロックされたリクエストの問題から解放され、Firecrawl CLIを使うことで信頼性の高いリアルタイムWebデータを手に入れることが可能です。スクレイピング・検索・マッピング・再帰的クロール・クラウドブラウザセッションを1つのCLIで実現します。出力はMarkdown/JSON/スクリーンショット/HTMLで直接ファイル保存、トークン数の最適化やLLM向けのコンテキスト維持も容易です。JavaScriptレンダリングページや動的サイト、プロテクトされたフローからも最新コンテンツを取得できます。
💡 TIP:
Firecrawl CLIコマンドを試す前に、Apidogを無料で入手してください。Firecrawl CLIが内部で利用するFirecrawl APIエンドポイントのテスト・デバッグがGUIでできます。APIキー、カスタムパラメータ、レスポンス形式も管理でき、エージェント統合やトラブルシュートを効率化します。
システム準備とワークスペース構築
まず、Node.js ≥18が必要です。バージョン確認:
node --version
バージョンが古い場合はnvmやパッケージマネージャでアップデートしてください。
出力ファイル管理用のディレクトリを作成:
mkdir firecrawl-cli-projects && cd firecrawl-cli-projects
テレメトリー無効化(任意):
export FIRECRAWL_NO_TELEMETRY=1
Firecrawl CLIのクイックインストールと初期化
AIエージェント用の推奨初期化フロー:
npx -y firecrawl-cli@latest init --all --browser
- Firecrawlアカウントのログイン/登録→APIキー生成/保存
- Claude Code, Cursorなどのエージェントスキルを自動設定
- MCP/サーバーレスブラウザアクセスも有効化
エージェントを再起動し、Firecrawl CLIの新機能を認識させてください。
グローバルインストール(頻繁利用向け)
npm install -g firecrawl-cli
firecrawl --version
どのディレクトリでも即コマンド実行可能になります。
認証と設定確認
firecrawl login
ブラウザでOAuth認証。手動設定もOK:
export FIRECRAWL_API_KEY=fc-your-key-here
ステータス確認:
firecrawl --status
構成確認:
firecrawl view-config
アカウント切り替え:
firecrawl logout
セルフホスト用途:
firecrawl --api-url http://localhost:3002
スクレイピングコマンドの基本
特定URLからメインコンテンツ抽出:
firecrawl scrape https://example.com --only-main-content
出力をファイル保存:
firecrawl scrape https://example.com --only-main-content -o output.md
複数フォーマット同時取得:
firecrawl scrape https://example.com --format markdown,json,html,links,images --pretty
スクリーンショット取得:
firecrawl scrape https://example.com --screenshot
遅いサイトに待機:
firecrawl scrape https://example.com --wait-for 5000
タグフィルタで抽出範囲制御:
firecrawl scrape https://docs.example.com --include-tags main,article --exclude-tags nav,footer,script
パフォーマンス測定:
firecrawl scrape https://example.com --timing
ウェブ検索の自動化
インターネット検索→上位結果を一括スクレイピング:
firecrawl search "latest AI agent benchmarks" --scrape --limit 8 --scrape-formats markdown
期間・場所・ソース指定でフィルタ:
firecrawl search "example query" --tbs qdr:w
サイトマッピング・URL検出
サイト全体のURLリスト出力:
firecrawl map https://example.com -o sitemap.json
robots.txtを自動考慮。得られたURLを後続コマンドに利用。
サイト全体の再帰クロール
全ページをクロール&ファイル保存:
firecrawl crawl https://example.com --wait --progress -o crawl-output.json
- 深さ、ページ数、並行数の制御でコスト管理
- 進捗レポートで大規模ジョブを監視/キャンセル
ブラウザセッション自動化
クラウドブラウザで動的フローを再現:
firecrawl browser launch-session
アクション例:
firecrawl browser execute "open https://news.ycombinator.com" --session <id>
firecrawl browser execute "click .titleline > a" --session <id>
firecrawl browser execute "scrape" --session <id>
セッション終了でリソース解放。
詳細設定とグローバルフラグ
一括設定:
firecrawl config --api-url https://your-custom-endpoint --concurrency 5
- JSON出力強制やヘッダー調整も可能
-
--statusでクレジット監視 - シェルプロファイルに
FIRECRAWL_API_KEYをエクスポート推奨
AIコーディングエージェントとの統合
npx -y firecrawl-cli@latest init --allでスキル登録。
エージェントはCLIコマンドを自動検出・実行。
生データではなくローカルファイルパスを返すため、LLMのコンテキスト消費も最適化されます。
トラブルシューティング
- 認証失敗時:
firecrawl loginを再実行 - レート制限:並行数を下げるorプランアップグレード
- JS重めサイトで空データ:
--wait-for増加・--only-main-content併用 - 診断用:
--timing活用 - キー切替:
firecrawl logoutでクリア
ベストプラクティス
- ノイズ除去には常に
--only-main-contentを活用 - ファイル名・フォルダを整理し、出力ディレクトリはバージョン管理
- フルクロール前は小規模テスト推奨
- 検索→マッピング→クロールのパイプライン活用
- クレジット消費を定期レビューし、コスト最適化
ApidogでFirecrawl CLIワークフローを強化
Apidogを無料でダウンロードし、Firecrawl APIエンドポイント(スクレイピング、検索、クロールなど)をプロジェクトにインポート。
- APIリクエストを可視化
- Firecrawl CLI APIキーを変数で管理
- レスポンスをモック&自動テスト
- ターミナル実行前に複雑なオプションやカスタムペイロードをデバッグ
Firecrawl CLI+Apidogの組み合わせで、API検証と最新Webデータ取得の信頼性が飛躍的に向上します。
結論
ここまでで、Firecrawl CLIのインストール・認証から、高度なスクレイピング・検索・マッピング・クロール・ブラウザ自動化まで、実践的なワークフローを一通り習得できます。Firecrawl CLIはWebアクセスを効率的なターミナルパイプラインに変換し、エージェントや開発者の生産性を最大化します。
今すぐinitコマンドでセットアップし、スクレイピングをテストし、実案件やエージェント統合に活用を始めましょう。フラグやオプションを工夫すれば、成果も飛躍的に向上します。
Apidogを今すぐ無料で導入し、Firecrawl CLIのテストやAPI検証を強化してください。Firecrawl CLIでリアルタイムなWeb活用力を手に入れましょう。
追加リソース
- Firecrawl CLI ドキュメント → https://docs.firecrawl.dev/sdks/cli
- Firecrawl 公式サイト → https://www.firecrawl.dev
- GitHub リポジトリ → https://github.com/firecrawl/cli
- API リファレンス → https://docs.firecrawl.dev/api-reference
- ダッシュボード / API キー → https://app.firecrawl.dev
- Apidog 無料 API クライアント → https://apidog.com/?utm_source=dev.to&utm_medium=wanda&utm_content=n8n-post-automation
Top comments (0)