خلاصة القول
يتيح لك الفيديو المرجعي في Seedance 2.0 تثبيت الحركة — مثل حركات الكاميرا، تصميم رقصات الشخصيات، التوقيت — إلى مقطع موجود بدلاً من وصف كل شيء بالنص. استخدم مقاطع مرجعية تتراوح مدتها من 3 إلى 8 ثوانٍ: لقطة واحدة، بدون قصات سريعة، وبضغط H.264 نظيف. اجعل المطالبات النصية قصيرة (ثلاث صفات أو أقل للأسلوب). يصف النص ما لا يمكن للمرجع إظهاره؛ بينما يتولى المرجع معالجة الحركة. إذا انحرف إخراجك أو تجاهل المرجع، اتبع الخطوات العملية لاستكشاف الأخطاء وإصلاحها في هذا الدليل.
مقدمة
توليد الفيديو باستخدام النص يعمل بكفاءة للمفاهيم العامة مثل المشاهد الجوية أو الاتجاهات البصرية المتنوعة. لكن إذا كانت الحركة محددة مسبقًا — مثل إيماءة دقيقة أو تقطيع في الحركة أو حتى تقريب الكاميرا — فالنص وحده لا يكفي.
الفيديو المرجعي يعالج هذه المشكلة: قدّم مقطعًا يوضح الحركة المطلوبة، وسيقوم Seedance 2.0 بتوليد فيديو جديد يحاكي الحركة مع محتوى جديد تحدده بالنص.
في هذا الدليل ستجد متى تستخدم الفيديو المرجعي مقابل النص فقط، كيفية إعداد المقاطع المرجعية بشكل عملي، وكيفية معالجة المشاكل الشائعة خطوة بخطوة.
متى تستخدم الفيديو المرجعي
استخدم الفيديو المرجعي في الحالات التالية:
- الإيماءات الدقيقة: مثل توقيت "نقرة إبهام" أو "إيماءة رأس متزامنة مع نبضة معينة". النص لا يلتقط التوقيت بدقة؛ المقطع المرجعي يحقق ذلك.
- تصميم الرقصات: نمط حركة ثابت مثل مشية منتظمة أو حركة جسدية متكررة.
- حركات الكاميرا: تقريب بطيء، حركة مدارية، أو تغيير إطار دقيق يصعب وصفه نصيًا.
- مزامنة الإيقاع: ربط الحركة بإشارة صوتية أو إيقاع موسيقي، حيث قراءة التوقيت من الفيديو المرجعي أدق بكثير.
استخدم النص وحده إذا كان:
- الهدف مفهومًا عامًا أو مشهدًا جويًا حيث التنوع مطلوب.
- تريد استكشاف توجهات بصرية مختلفة لنفس الحركة.
- لا تملك مقطعًا مرجعيًا مناسبًا والحركة بسيطة ويمكن وصفها بسهولة.
إعداد المقاطع المرجعية
للحصول على نتائج دقيقة، تأكد من أن مقطعك المرجعي يحقق التالي:
- المدة: بين 3 إلى 8 ثوانٍ. أقل من ذلك يضعف الفائدة، وأطول يسبب تشويشًا للنموذج.
- الاستمرارية: مقطع واحد متواصل بدون أي قصات أو تعديلات.
- الجودة والضغط: استخدم ضغط H.264 نظيف بدون ظهور تكتلات أو تشوهات.
- وضوح الموضوع: الخلفية البسيطة والإضاءة الثابتة تسهّل على النموذج فهم الحركة. تجنب الخلفيات المزدحمة.
قائمة تحقق قبل الرفع:
- [ ] أقل من 8 ثوانٍ
- [ ] لقطة واحدة متواصلة
- [ ] ضغط نظيف بدون تكتلات
- [ ] وضوح الموضوع مقابل الخلفية
- [ ] إضاءة ثابتة
التحفيز باستخدام مقطع مرجعي
عند الجمع بين مقطع مرجعي ونص، ركّز على جعل النص مكملًا للمرجع لا مكررًا له.
استخدم النص لتحديد:
- النمط (إضاءة، ألوان، نغمة بصرية)
- هوية الموضوع (من يظهر أو ماذا يظهر)
- سياق الكاميرا (إن لم يكن واضحًا من المرجع)
- إضافة قيد أو اثنين عند الحاجة
هيكل مطالبة عملي:
النمط: [2-3 واصفات للإضاءة/الألوان]
الموضوع: [وصف واضح للهوية]
الكاميرا: [إذا اختلفت عن المرجع]
نية المرجع: "احترم الحركة من المرجع: أعد تفسير الملمس واللون."
يجب ألا: [قيد محدد]
مثال عملي:
المقطع المرجعي: شخص يمشي بخطوات محددة
المطالبة النصية:
النمط: ضوء فترة ما بعد الظهيرة الدافئ، درجات لون ذهبية
الموضوع: رجل يرتدي بدلة رمادية، في أوائل الأربعينات، بوقفة واثقة
احترم الحركة من المرجع: أعد تفسير الملمس واللون.
يجب ألا: يغير وتيرة المشي
ملاحظة عملية: لا تستخدم أكثر من ثلاث صفات للنمط حتى لا تشتت النموذج وتضعف النتيجة.
استخدام الـ API عبر WaveSpeedAI
للوصول إلى Seedance 2.0 استخدم واجهة برمجة التطبيقات الخاصة بـ WaveSpeedAI. نقطة النهاية للفيديو المرجعي:
POST https://api.wavespeed.ai/api/v2/seedance/v2/image-to-video
Authorization: Bearer {{WAVESPEED_API_KEY}}
Content-Type: application/json
{
"prompt": "ضوء فترة ما بعد الظهيرة الدافئ، درجات لون ذهبية. رجل يرتدي بدلة رمادية يمشي للأمام. احترم الحركة من المرجع.",
"image_url": "https://example.com/subject-reference.jpg",
"reference_video_url": "https://example.com/motion-reference.mp4",
"duration": 5,
"aspect_ratio": "16:9"
}
الاختبار باستخدام Apidog
قبل بناء تكاملك البرمجي، جهز مجموعة اختبار باستخدام Apidog.
إعداد البيئة:
- أنشئ بيئة جديدة وأضف متغيرًا سريًا باسم
WAVESPEED_API_KEY.
سير العمل:
- الطلب الأول: يبدأ عملية التوليد.
- الطلب الثاني: يستعلم عن حالة المهمة.
الطلب 1:
POST https://api.wavespeed.ai/api/v2/seedance/v2/image-to-video
Authorization: Bearer {{WAVESPEED_API_KEY}}
Content-Type: application/json
{
"prompt": "{{motion_prompt}}",
"image_url": "{{subject_image}}",
"reference_video_url": "{{reference_clip}}",
"duration": {{duration}},
"aspect_ratio": "16:9"
}
في تبويب "الاختبارات"، استخرج معرف المهمة:
pm.environment.set("job_id", pm.response.json().id);
الطلب 2:
GET https://api.wavespeed.ai/api/v2/predictions/{{job_id}}
Authorization: Bearer {{WAVESPEED_API_KEY}}
تأكيد النتيجة:
جسم الاستجابة يجب أن يحوي حقل الحالة بقيمة "completed".
دليل استكشاف الأخطاء وإصلاحها
تذبذب الحركة
- قص المقطع لإزالة التعديلات الدقيقة من الأطراف.
- قلل الضوضاء البصرية في اللقطات.
- ثبت الكاميرا أثناء التصوير بدلاً من الاعتماد على التثبيت لاحقًا.
- قلل طول المرجع إلى 3-5 ثوانٍ.
- بسّط المطالبة النصية بإزالة الصفات المتعارضة.
تجاهل المرجع (النموذج لا يلتزم بالمقطع المرجعي)
- بالغ في الحركة وركز الموضوع في وسط الإطار.
- اجعل كل مقطع يركز على نوع حركة واحد فقط.
- وضّح الحركة في النص: "انسخ حركة الكاميرا من المرجع".
- استخدم أقصر فترة نظيفة (2-3 ثوانٍ) من المرجع.
- أضف علامات مرئية (مثل شريط لاصق) لتوضيح المنظر في حركة الكاميرا.
انحراف النمط (المخرجات لا تطابق الجمالية المطلوبة)
- قلل واصفات النمط إلى اثنين أو ثلاثة فقط.
- أضف إطارًا مرجعيًا ثابتًا بجانب الفيديو المرجعي.
- بسّط التفاصيل والأنماط في المقطع المرجعي.
- حافظ على ثبات الإعدادات بين عمليات التوليد.
- ركز أولاً على تثبيت الحركة، ثم عدل المظهر لاحقًا.
الحقوق والموافقة
إذا كان الفيديو المرجعي يحتوي على أشخاص يمكن التعرف عليهم، يجب الحصول على موافقة واضحة.
الخطوات العملية:
- احصل على موافقة كتابية من كل شخص يظهر في المقطع.
- إذا كان هناك قاصرون، احصل على توقيعات أولياء الأمور.
- تأكد أن مواقع التصوير تسمح بالاستخدام التجاري.
- تجنب الشعارات أو العلامات التجارية في المرجع.
- احتفظ بسجلات التواريخ والموافقات.
تنطبق هذه القواعد على المرجع وكذلك أي موضوعات قابلة للتحديد تظهر في الناتج.
الأسئلة الشائعة
هل يحل الفيديو المرجعي محل الصورة المرجعية؟
لا، الصورة المرجعية تضبط مظهر الموضوع، أما الفيديو المرجعي فيحدد الحركة. استخدم الاثنين معًا للتحكم الكامل.
ما هو الطول المناسب للمقطع المرجعي؟
من 3 إلى 8 ثوانٍ. أقصر: حركة غير كافية. أطول: إخراج غير متسق.
هل يمكنني استخدام مقطع مرجعي من نوع مختلف؟
نعم. يمكنك نقل الحركة من مشية إنسان إلى روبوت، مع استبدال المحتوى حسب النص والصورة المرجعية.
ما هي دقة المقطع المرجعي المثالية؟
720p أو أعلى. الدقة المنخفضة تقلل وضوح الحركة وتضعف الجودة.
هل يمكن توليد عدة مقاطع من نفس المرجع؟
نعم. يمكنك استخدام نفس الفيديو المرجعي مع مطالبات مختلفة لتوليد مشاهد متنوعة بنفس الحركة.
Top comments (0)