الرئيس التنفيذي
أشرف الحادي

رئيس التحرير
فاطمة مهران

علي بابا كلاود تطلق نموذج لغة الرؤية الكبيرة مفتوح المصدر مع القدرة على فهم الصور

علي بابا كلاود

 أطلقت علي بابا كلاود، الشركة الرئيسية المسؤولة عن التكنولوجيا الرقمية والذكاء في مجموعة علي بابا، نموذجين مفتوحي المصدر للغة الرؤية الكبيرة Qwen-VL وQwen-VL-Chat المعدّل لغايات التحادث. ويمكن للنموذجين فهم الصور والنصوص والمربعات المحددة في الأوامر وتسهيل الإجابة على الأسئلة المتعددة باللغتين الإنجليزية والصينية.

ويعتبر Qwen-VL نسخة متعددة الأوضاع من Qwen-7B، وهو نموذج علي بابا كلاود المؤلف من 7 مليارات عامل متغير لنموذجها اللغوي الكبير Tongyi Qianwen (المتوفر أيضًا على ModelScope كمصدر مفتوح). ويستطيع Qwen-VL، القادر على فهم كل من مدخلات الصور والأوامر النصية باللغتين الإنجليزية والصينية، أداء مهام مختلفة مثل الرد على الاستعلامات المفتوحة بشأن الصور المختلفة وإنشاء تعليقات للصور.

ويقدّم Qwen-VL-Chat تفاعلاً أكثر تعقيدًا، مثل مقارنة مدخلات الصور المتعددة والإجابة على جولات متعددة من الأسئلة. وبالاستفادة من تقنيات المواءمة، يعرض مساعد الذكاء الاصطناعي مجموعة من القدرات الإبداعية، والتي تشمل كتابة الشعر والقصص بناءً على الصور المدخلة، وتلخيص محتوى الصور المتعددة، وحل الأسئلة الحسابية المعروضة في الصور.

المساهمة في المصادر المفتوحة والشمولية

في محاولة لدعم انتشار تقنيات الذكاء الاصطناعي، شاركت علي بابا كلاود كود نظام ترميز النموذج وأوزانه وبياناته الموثقة مع الأكاديميين والباحثين والمؤسسات التجارية في جميع أنحاء العالم. ويمكن الوصول إلى هذه المساهمة في مجتمع المصادر المفتوحة عبر مجتمع نماذج الذكاء الاصطناعي التابع لمجموعة علي بابا ModelScope ومنصة الذكاء الاصطناعي التعاونية Hugging Face. أما بالنسبة للاستخدامات التجارية، يمكن للشركات التي لديها أكثر من 100 مليون مستخدم نشط شهريًا طلب ترخيص من علي بابا كلاود.

ومن الممكن أن يؤدي تقديم هذه النماذج، القادرة على استخلاص المعاني والمعلومات من الصور، إلى إحداث ثورة في التفاعل مع المحتوى المرئي. فمن خلال الاستفادة من مزايا فهم الصور والقدرة على الإجابة على الأسئلة، يمكن للنماذج مثلاً تقديم المساعدة المعلوماتية للمعاقين بصريًا أثناء التسوق عبر الإنترنت في المستقبل.

وقد تم تدريب نموذج Qwen-VL مسبقًا على مجموعات بيانات الصور والنصوص. وبالمقارنة مع غيره من نماذج لغة الرؤية الكبيرة مفتوحة المصدر التي يمكنها معالجة وفهم الصور بدقة 224*224، يمكن لـ Qwen-VL التعامل مع مدخلات الصور بدقة 448*448، مما يؤدي إلى التعرف على الصور وفهمها بشكل أفضل.

واستنادًا إلى مقارنات مرجعية مختلفة، سجّل Qwen-VL أداءً متميزًا في العديد من مهام اللغة المرئية، بما في ذلك إنشاء الشروح التوضيحية، والإجابة على الأسئلة المرئية العامة، والإجابة على الأسئلة المرئية الموجهة نحو النص، واكتشاف الأشياء.

كما حقق Qwen-VL-Chat أيضًا نتائج رائدة باللغتين الصينية والإنجليزية في حوار الصور والنصوص ومستويات التوافق مع البشر، وفقًا لاختبار المقارنة المرجعية من علي بابا كلاود. وشمل هذا الاختبار أكثر من 300 صورة و800 سؤال و27 فئة.

وفي وقت سابق من هذا الشهر، قامت علي بابا كلاود بفتح مصادر نماذجها اللغوية الكبيرة المكونة من 7 مليار عامل متغير Qwen-7B وQwen-7B-Chat في إطار مساهمتها المستمرة في مجتمع المصادر المفتوحة. وقد شهد النموذجان أكثر من 400 ألف عملية تنزيل خلال شهر من إطلاقهما.

أخبار ذات صلة

ڤودافون مصر تحصد جائزتي “أفضل شبكة محمول” و”أفضل إنترنت ثابت” لعام 2025

إنفستجيت» تحتفي بأبرز الابتكارات والإنجازات في السوق العقاري المصري خلال « Invest-Gate ACE Awards 2025»

تقرير كاسبرسكي يكشف أنّ نصف كلمات المرور المخترقة عام 2025 تعرضت للتسريب مسبقاً

تيك توك تحذف 18.9 مليون فيديو مخالف لتعزيز السلامة الرقمية في المنطقة

اكتشفوا سيارة بيجو بوليجون الاختبارية في بوليجون سيتي، جزيرة داخل عالم فورتنايت.

الخدمات الإيجارية بحلتها الجديدة على “عقاري” عبر منصة “الشارقة الرقمية”

ميزات في واتساب لازم تستخدمها دلوقتي

مواصفات vivo S50 وسعره في الأسواق العربية

آخر الأخبار
وزير التربية والتعليم: قطاع التعليم الفني فرصة ذهبية للتعاون مع بنك الاستثمار الأوروبي الأرصاد: استمرار السحب الممطرة بلقاهرة الكبرى والوجه البحرى وشمال الصعيد رئيس الوزراء يلتقي محافظ البنك المركزي لمتابعة جهود التنسيق المشترك في عدد من الملفات الاقتصادية الخليج العربي للاستثمار توقع مذكرة تفاهم مع جرين هاربر للاستثمار لتأسيس صندوق استثماري برأس مال 500 ... احتفالا بعيد ميلادها الثالث.. ظهور «الكينج كوبرا» كحارس لأكبر مدينة العاب ترفيهية بالغردقة يجذب الأن... الفريق أسامة ربيع يلتقي وفد بعثة صندوق النقد الدولي ڤودافون مصر تحصد جائزتي “أفضل شبكة محمول” و”أفضل إنترنت ثابت” لعام 2025 وزير العمل يستقبل خبيرة منظمة العمل الدولية لبحث الاستعدادات لإصدار الاستراتيجية الوطنية للسلامة وال... نوفارتس تقود حملة وطنية لتعزيز الوعي والفحص المبكر لسرطان الثدي في أماكن العمل بالإمارات “Invest-Gate ACE Awards 2025: Celebrating Sector Excellence” إنفستجيت» تحتفي بأبرز الابتكارات والإنجازات في السوق العقاري المصري خلال « Invest-Gate ACE Awards 20... Kaspersky’s latest research reveals that the majority of compromised passwords not only violate pass... تقرير كاسبرسكي يكشف أنّ نصف كلمات المرور المخترقة عام 2025 تعرضت للتسريب مسبقاً غرفة أبوظبي وصندوق الإمارات للنمو يوقعان اتفاقية لدعم الشركات الصغيرة والمتوسطة أبوظبي تستضيف مؤتمر "كامبدن" العالمي لمالكي الشركات والمكاتب العائلية جمال الدين: المنطقة الاقتصادية لقناة السويس تسعى جاهدةً لخفض الفاتورة الاستيرادية وتوطين الصناعة ودع... اتفاقية بين مجلس أبوظبي للشركات العائلية وصندوق الإمارات للنمو لدعم الشركات وريادة الأعمال وزير الاستثمار يبحث مع اتحاد المستثمرات العرب تعزيز التعاون المشترك لفتح آفاق استثمارية جديدة في أف... رئيس الشركة القابضة لمصرللطيران يلتقي سفير إيطاليا بالقاهرة لبحث تعزيز التعاون وزيادة الرحلات بين ال... بمحفظة تمويلات بلغت 100 مليار جنيه.. نتائج أعمال إيجابية لـ "بنك بيت التمويل الكويتي – مصر" بنهاية س...