تكنولوجيا

“علي بابا” تطلق نموذجاً مفتوح المصدر لإنشاء وتحرير الفيديو

كتب:
أشرف الحادي
15/05/2025
4:32 مساءً

كشفت “علي بابا” عن نموذج Wan 2.1-VACE، وهو أحدث نموذج شامل مفتوح المصدر لإنشاء وتحرير الفيديو. وتجمع هذه الأداة المبتكرة وظائف متعددة لمعالجة الفيديوهات في نموذج واحد بهدف تبسيط عملية إنشاء الفيديو وتعزيز الكفاءة والإنتاجية.

وبوصفه جزءاً من نموذج علي بابا الكبير لتوليد الفيديوهات- سلسلة Wan2.1 – يعد VACE أول نموذج مفتوح المصدر في القطاع يوفر حلاً موحدًا لمختلف مهام توليد الفيديوهات وتحريرها.

ويدعم Wan2.1-VACE توليد الفيديو باستخدام مدخلات متعددة الوسائط تشمل النص والصورة والفيديو، مع توفير إمكانيات تحرير فيديو شاملة. وتشمل ميزات التحرير إمكانية الرجوع إلى الصور أو الإطارات، وإعادة تلوين الفيديو، وتعديل أجزاء محددة منه، والتمديد المكاني والزماني، مما يتيح الجمع المرن بين مهام متنوعة لتعزيز الإبداع.

وباستخدام هذه الأداة المتقدمة، يمكن للمستخدمين إنشاء فيديو يحتوي على مواضيع تفاعلية محددة بناءً على عينات من الصور، وإضفاء الحيوية على الصور الثابتة بإضافة تأثيرات حركة طبيعية. كما يمكنهم الاستمتاع بوظائف إعادة تلوين الفيديو المتقدمة، مثل نقل الوضعية، والتحكم في الحركة، والتحكم في العمق، وإعادة التلوين.

ويدعم النموذج أيضاً إضافة أو تعديل أو حذف مناطق محددة من الفيديو دون التأثير على البيئة المحيطة. كما يسمح بتمديد حدود الفيديو مع ملء المحتوى بذكاء لإثراء التجربة البصرية.

وبصفته نموذج ذكاء اصطناعي متكامل، يوفر Wan2.1-VACE تنوعاً لا مثيل له، مما يتيح للمستخدمين الجمع بسلاسة بين وظائف متعددة وإطلاق العنان لإمكانياتهم الإبداعية. إذ يمكن للمستخدمين تحويل صورة ثابتة إلى فيديو مع التحكم في حركة الكائنات من خلال تحديد مسار الحركة. ويمكنهم استبدال الشخصيات أو الكائنات بسلاسة بمراجع محددة، وتحريك الشخصيات المرجعية، والتحكم في الوضعيات، وتوسيع الصورة الرأسية أفقيًا لإنشاء فيديو أفقي مع إضافة عناصر جديدة من خلال المراجع.

تقنيات مبتكرة

يستخدم Wan2.1-VACE العديد من التقنيات المبتكرة لمراعاة المتطلبات المختلفة لمهام تحرير الفيديو أثناء البناء والتصميم. وتدعم واجهته الموحدة، المسماة “وحدة حالة الفيديو”، المعالجة الموحدة للمدخلات متعددة الوسائط مثل النصوص والصور والفيديو والأقنعة.

ويستخدم النموذج بنية “معدل السياق” التي تدخل مفاهيم مهام مختلفة باستخدام تمثيلات رسمية للأبعاد الزمنية والمكانية. ويتيح هذا التصميم المبتكر للنموذج إدارة مجموعة واسعة من مهام تركيب الفيديو بمرونة.

وبفضل التطورات في هندسة النماذج، يمكن تطبيق Wan2.1-VACE على نطاق واسع في الإنتاج السريع للفيديوهات القصيرة على وسائل التواصل الاجتماعي، وإنشاء محتوى للإعلان والتسويق، ومرحلة ما بعد الإنتاج ومعالجة المؤثرات الخاصة في الأفلام والتلفزيون، وفي إنتاج فيديوهات التدريب التعليمي.

ويتطلب تدريب نماذج إنشاء الفيديوهات موارد حاسوبية هائلة وكميات هائلة من بيانات التدريب عالية الجودة. وبفضل الوصول المفتوح، يسهل على المزيد من الشركات الاستفادة من الذكاء الاصطناعي، مما يمكّنها من إنشاء محتوى مرئي عالي الجودة مصمم خصيصًا لتلبية احتياجاتها بسرعة وبتكلفة معقولة.

وبصفتها واحدة من أوائل شركات التكنولوجيا العالمية الكبرى التي جعلت نماذج الذكاء الاصطناعي واسعة النطاق التي طورتها بنفسها مفتوحة المصدر، أطلقت علي بابا أربعة نماذج Wan2.1 مفتوحة المصدر في فبراير 2025، وفي الشهر الماضي، أطلقت نموذجًا لإنشاء الفيديو يدعم إنشاء الفيديو بإطارات بداية ونهاية. وحتى الآن، شهدت النماذج أكثر من 3.3 مليون عملية تنزيل على Hugging Face وModelScope.