الرئيس التنفيذي
أشرف الحادي

رئيس التحرير
فاطمة مهران

علي بابا كلاود تطلق نموذج لغة الرؤية الكبيرة مفتوح المصدر مع القدرة على فهم الصور

علي بابا كلاود

 أطلقت علي بابا كلاود، الشركة الرئيسية المسؤولة عن التكنولوجيا الرقمية والذكاء في مجموعة علي بابا، نموذجين مفتوحي المصدر للغة الرؤية الكبيرة Qwen-VL وQwen-VL-Chat المعدّل لغايات التحادث. ويمكن للنموذجين فهم الصور والنصوص والمربعات المحددة في الأوامر وتسهيل الإجابة على الأسئلة المتعددة باللغتين الإنجليزية والصينية.

ويعتبر Qwen-VL نسخة متعددة الأوضاع من Qwen-7B، وهو نموذج علي بابا كلاود المؤلف من 7 مليارات عامل متغير لنموذجها اللغوي الكبير Tongyi Qianwen (المتوفر أيضًا على ModelScope كمصدر مفتوح). ويستطيع Qwen-VL، القادر على فهم كل من مدخلات الصور والأوامر النصية باللغتين الإنجليزية والصينية، أداء مهام مختلفة مثل الرد على الاستعلامات المفتوحة بشأن الصور المختلفة وإنشاء تعليقات للصور.

ويقدّم Qwen-VL-Chat تفاعلاً أكثر تعقيدًا، مثل مقارنة مدخلات الصور المتعددة والإجابة على جولات متعددة من الأسئلة. وبالاستفادة من تقنيات المواءمة، يعرض مساعد الذكاء الاصطناعي مجموعة من القدرات الإبداعية، والتي تشمل كتابة الشعر والقصص بناءً على الصور المدخلة، وتلخيص محتوى الصور المتعددة، وحل الأسئلة الحسابية المعروضة في الصور.

المساهمة في المصادر المفتوحة والشمولية

في محاولة لدعم انتشار تقنيات الذكاء الاصطناعي، شاركت علي بابا كلاود كود نظام ترميز النموذج وأوزانه وبياناته الموثقة مع الأكاديميين والباحثين والمؤسسات التجارية في جميع أنحاء العالم. ويمكن الوصول إلى هذه المساهمة في مجتمع المصادر المفتوحة عبر مجتمع نماذج الذكاء الاصطناعي التابع لمجموعة علي بابا ModelScope ومنصة الذكاء الاصطناعي التعاونية Hugging Face. أما بالنسبة للاستخدامات التجارية، يمكن للشركات التي لديها أكثر من 100 مليون مستخدم نشط شهريًا طلب ترخيص من علي بابا كلاود.

ومن الممكن أن يؤدي تقديم هذه النماذج، القادرة على استخلاص المعاني والمعلومات من الصور، إلى إحداث ثورة في التفاعل مع المحتوى المرئي. فمن خلال الاستفادة من مزايا فهم الصور والقدرة على الإجابة على الأسئلة، يمكن للنماذج مثلاً تقديم المساعدة المعلوماتية للمعاقين بصريًا أثناء التسوق عبر الإنترنت في المستقبل.

وقد تم تدريب نموذج Qwen-VL مسبقًا على مجموعات بيانات الصور والنصوص. وبالمقارنة مع غيره من نماذج لغة الرؤية الكبيرة مفتوحة المصدر التي يمكنها معالجة وفهم الصور بدقة 224*224، يمكن لـ Qwen-VL التعامل مع مدخلات الصور بدقة 448*448، مما يؤدي إلى التعرف على الصور وفهمها بشكل أفضل.

واستنادًا إلى مقارنات مرجعية مختلفة، سجّل Qwen-VL أداءً متميزًا في العديد من مهام اللغة المرئية، بما في ذلك إنشاء الشروح التوضيحية، والإجابة على الأسئلة المرئية العامة، والإجابة على الأسئلة المرئية الموجهة نحو النص، واكتشاف الأشياء.

كما حقق Qwen-VL-Chat أيضًا نتائج رائدة باللغتين الصينية والإنجليزية في حوار الصور والنصوص ومستويات التوافق مع البشر، وفقًا لاختبار المقارنة المرجعية من علي بابا كلاود. وشمل هذا الاختبار أكثر من 300 صورة و800 سؤال و27 فئة.

وفي وقت سابق من هذا الشهر، قامت علي بابا كلاود بفتح مصادر نماذجها اللغوية الكبيرة المكونة من 7 مليار عامل متغير Qwen-7B وQwen-7B-Chat في إطار مساهمتها المستمرة في مجتمع المصادر المفتوحة. وقد شهد النموذجان أكثر من 400 ألف عملية تنزيل خلال شهر من إطلاقهما.

أخبار ذات صلة

سوني تكشف عن مستشعر Lytia 901 بدقة 200 ميجابكسل للهواتف

جامعة مانشستر – دبي تحتفي بتخريج دفعة 2025 وتواصل إعداد قادة المستقبل في الشرق الأوسط

وزيرا الاتصالات والتضامن يشهدان توقيع بروتوكول تعاون بين “إيتيدا” وشركة “دى إكس سي تكنولوجي” لإطلاق برنامج ITIDA-DXC Dandelion

موسكو تطلق الحدث العالمي الرائد لألعاب الفيديو: أسبوع الألعاب الدولي 2025

تعاون بين “الفضاء الوطني” و”تاليس ألينيا سبيس” في تقنيات الملاحة الفضائية

إعلانات يانغو” و “تريدلينغ” توقعان مذكرة تفاهم

جلاكسي S26 من سامسونج قادم بقوة: شحن فائق وأبرز 6 تطويرات منتظرة

مواصفات هاتف Infinix Hot 60 وسعره في الوطن العربي

آخر الأخبار
فنادق ريكسوس مصر تتألق بعروض موسم الأعياد وتقدم باقات إقامة فاخرة للضيوف مصر تؤكد ريادتها كوجهة استراتيجية للاستثمار الأجنبي خلال منتدى قادة الاستثمار في الدوحة رئيس الوزراء يتفقد منطقة مسجد الحاكم بأمر الله ومشروعي بوتيك أوتيل الشوربجي رئيس الوزراء يتفقد أعمال إعادة إحياء منطقة حارة الروم وباب زويلة وزير قطاع الأعمال يلتقي الوزير الأول للجمهورية الجزائرية على هامش المؤتمر الوزاري الأفريقي للأدوية وزير الإسكان ومحافظ كفر الشيخ يفتتحان محطة مياة شرب دقميرة بطاقة ١٠ آلاف م٣ يوميًا الجهاز المركزي للمحاسبات نائبًا لرئيس فريق المراجعين الخارجيين للأمم المتحدة مصر تحيي اليوم العالمي للتضامن مع الشعب الفلسطيني وزير التربية والتعليم يقرر اتخاذ إجراءات فورية وحاسمة تجاه واقعة مدرسة عبد السلام المحجوب بالإسكندري... مشاركة مصر في “الاجتماع الإقليمي لرؤساء مكاتب حقوق المؤلف في الدول العربية” بالجزائر البورصة المصرية تشارك في جلسة حوارية رئيسية خلال فعاليات المؤتمر السنوي لاتحاد البورصات الإفريقية رئيس الوزراء يقوم بجولة تفقدية بمشروعات إعادة إحياء عدد من المناطق بالقاهرة التاريخية وزير الزراعة يعلن تحقيق مصر 8.5 مليون طن صادرات زراعية حتى الآن وزير الخارجية يتوجه إلى باكستان باترول.. إرث عريق وذكاء يواكب المستقبل الصحة: 3.6 مليون سيدة حامل يخضعن للفحص الشامل ضمن المبادرة الرئاسية للعناية بصحة الأم والجنين المقاولون العرب تفوز بجائزة أفضل شركة مقاولات بأوغندا للسنة الثامنة على التوالي وزير التعليم العالي يترأس اجتماع المجلس الأعلى للجامعات بجامعة قناة السويس بنك ABC – مصر يواصل تحقيق نتائج مالية قوية خلال الربع الثالث من عام 2025 التضامن الاجتماعي: إطلاق الخط الساخن الموحد رقم 17673 التابع للوحدة المركزية للعمل الأهلي