أداة Firecrawl CLI: أداة الطرفية الموحدة لاستخلاص البيانات من الويب
Firecrawl CLI هي أداة متقدمة للمطورين ووكلاء الذكاء الاصطناعي، تتيح لك استخراج البيانات، البحث، رسم خرائط المواقع، الزحف الآلي، وأتمتة المتصفح لأي موقع ويب، مع دعم تنسيقات ماركداون نظيف، JSON، لقطات شاشة، والمزيد، مع حفظ كل شيء مباشرة في نظام الملفات.
يمكنك تشغيل Firecrawl CLI مباشرة عبر npx firecrawl (بدون تثبيت مسبق)، أو تثبيته عالميًا، ثم ربطه بكل من Claude Code أو Cursor أو OpenCode عبر أمر واحد firecrawl init لإضافة المهارة تلقائيًا.
💡 قبل تشغيل أول أمر Firecrawl CLI، احصل على Apidog مجانًا. ستتمكن من اختبار وتصحيح Firecrawl API بصريًا (مفاتيح API، معلمات مخصصة، أشكال الاستجابة) في واجهة واحدة نظيفة. هذا يوفر عليك الوقت عند إعداد أو استكشاف تكامل الوكلاء.
لماذا Firecrawl CLI؟
- يقدم إخراج ماركداون نظيف أو JSON منظم أو HTML أو لقطات شاشة.
- يعالج المواقع الديناميكية المعقدة ويدعم استخراج المحتوى من صفحات معروضة عبر JavaScript.
- يمكن دمجه بسلاسة مع وكلاء مثل Claude Code و Cursor و OpenCode.
- يدير التزامن، وحدود المعدل، والتخزين المؤقت تلقائيًا.
- خيارات مرنة مثل تنسيقات الإخراج، مؤقتات الانتظار، وفلاتر دقيقة للمحتوى.
تحضير البيئة
- تأكد من وجود Node.js ≥18 تحقق عبر:
node --version
إذا لزم الأمر، حدث عبر nvm أو مدير الحزم.
- إنشاء مشروع منظم للمخرجات
mkdir firecrawl-cli-projects && cd firecrawl-cli-projects
هذا يسهل إدارة البيانات وربطها مع Git.
- اختياري: تعطيل القياس عن بعد
export FIRECRAWL_NO_TELEMETRY=1
تثبيت Firecrawl CLI وتهيئة الوكلاء (الطريقة الموصى بها)
شغّل أمر التثبيت والتهيئة مرة واحدة:
npx -y firecrawl-cli@latest init --all --browser
- سيتم فتح متصفح للمصادقة، وتخزين مفتاح API، وتهيئة المهارات للوكلاء المدعومين.
- أعد تشغيل الوكيل ليكتشف Firecrawl CLI.
للتثبيت العالمي (للاستخدام الدائم)
npm install -g firecrawl-cli
تحقق من التثبيت:
firecrawl --version
المصادقة والتحقق
- تسجيل الدخول:
firecrawl login
أو قم بتعيين مفتاح API يدويًا:
export FIRECRAWL_API_KEY=fc-your-key-here
- التحقق من الحالة:
firecrawl --status
- عرض الإعدادات:
firecrawl view-config
- تبديل الحسابات:
firecrawl logout
firecrawl login
- تشغيل محلي أو مستضاف ذاتيًا:
firecrawl --api-url http://localhost:3002
أوامر Firecrawl CLI الأساسية
1. استخلاص البيانات (Scrape)
- استخراج محتوى رئيسي من صفحة:
firecrawl scrape https://example.com --only-main-content
للإخراج في ملف:
firecrawl scrape https://example.com -o output.md --only-main-content
- استخراج بصيغ متعددة:
firecrawl scrape https://example.com --format markdown,json,html,links,images --pretty
- لقطات شاشة:
firecrawl scrape https://example.com --screenshot
- انتظار تحميل الصفحة:
firecrawl scrape https://example.com --wait-for 5000
- تصفية عناصر HTML مع تضمين/استبعاد:
firecrawl scrape https://docs.example.com --include-tags main,article --exclude-tags nav,footer,script
- قياس الأداء:
firecrawl scrape https://example.com --timing
2. البحث عبر الويب
- بحث ذكي واستخلاص النتائج:
firecrawl search "latest AI agent benchmarks" --scrape --limit 8 --scrape-formats markdown
- فلترة حسب الحداثة أو المصدر:
firecrawl search "موضوعك" --tbs qdr:w
3. رسم خريطة الموقع (Map)
- اكتشاف جميع روابط موقع:
firecrawl map https://example.com -o sitemap.json
4. الزحف الكامل (Crawl)
- زحف شامل وتحكم في العمق:
firecrawl crawl https://example.com --wait --progress -o crawl-output.json
5. أتمتة جلسات المتصفح
- فتح جلسة تفاعلية:
firecrawl browser launch-session
- تنفيذ إجراءات:
firecrawl browser execute "open https://news.ycombinator.com" --session <id>
firecrawl browser execute "click .titleline > a" --session <id>
firecrawl browser execute "scrape" --session <id>
تخصيص الإعدادات والأعلام
- تعيين عنوان API مخصص وتعديل التزامن:
firecrawl config --api-url https://your-custom-endpoint --concurrency 5
- إخراج JSON دائمًا أو تخصيص رؤوس الطلبات.
- راقب الرصيد قبل العمليات الكبيرة:
firecrawl --status
- تصدير مفتاح API بملف الـ shell لجلسات مستمرة.
دمج Firecrawl CLI مع وكلاء الترميز
- ثبّت المهارة مرة واحدة:
npx -y firecrawl-cli@latest init --all
- سيكتشفها الوكلاء تلقائيًا ويشغلون الأوامر عند الحاجة.
- Firecrawl CLI يعيد مسارات الملفات بدلًا من محتوى خام، ما يحافظ على كفاءة نافذة السياق.
استكشاف المشاكل الشائعة
-
فشل المصادقة: أعد تشغيل
firecrawl login. - بلوغ حدود المعدل: قلل التزامن أو حدّث خطتك من لوحة التحكم.
-
نتائج فارغة في مواقع ثقيلة JS: زد قيمة
--wait-forأو فعّل--only-main-content. -
تشخيص الأداء: استخدم
--timing. -
تبديل المفاتيح: امسح الاعتماديات بـ
firecrawl logout.
أفضل الممارسات
- استخدم دائمًا
--only-main-contentلمخرجات نظيفة. - اسم ملفات إخراج واضح ومجلدات منظمة.
- اختبر على نطاق صغير قبل زحف كامل.
- اتبع تدفق: بحث ← رسم خرائط ← زحف.
- تحكم في إصدارات أدلة الإخراج لمجموعات بيانات قابلة للتكرار.
- راقب رصيدك أسبوعيًا.
استكمال سير العمل مع Apidog
- حمّل Apidog مجانًا.
- استورد نقاط نهاية Firecrawl (scrape, search, crawl...) كـ collections.
- Apidog يعرض الطلبات، يخزن مفتاح API كمتغير، يحاكي الاستجابات، ويشغّل اختبارات تلقائية.
- اختبر إعدادات Firecrawl CLI المعقدة أو الحمولات الخاصة قبل التنفيذ الطرفي.
- الجمع بين Firecrawl CLI و Apidog يمنحك بيانات ويب محدثة وسلوك API موثوق.
الخاتمة
مع Firecrawl CLI تستطيع التحكم الكامل في استخراج البيانات، البحث، رسم الخرائط، الزحف، وأتمتة المتصفح من خلال الطرفية، مع دعم ذكي للوكلاء والمطورين.
ابدأ بأمر init، جرب أول عملية استخلاص، وطور سير عملك تدريجيًا. الاستخدام الذكي للأعلام والتجربة العملية ينتج عنه نتائج أفضل.
جرّب Apidog مجانًا الآن لتعزيز اختبارات Firecrawl CLI والتحقق من الـ API.
ثبّت Firecrawl CLI وابدأ في استخلاص بيانات الويب بكفاءة في الوقت الفعلي.
موارد إضافية
- وثائق Firecrawl CLI → https://docs.firecrawl.dev/sdks/cli
- الموقع الرئيسي لـ Firecrawl → https://www.firecrawl.dev
- مستودع GitHub → https://github.com/firecrawl/cli
- مرجع API → https://docs.firecrawl.dev/api-reference
- لوحة التحكم / مفتاح API → https://app.firecrawl.dev
- عميل Apidog API المجاني → https://apidog.com/?utm_source=dev.to&utm_medium=wanda&utm_content=n8n-post-automation
Top comments (0)