الرئيس التنفيذي
أشرف الحادي

رئيس التحرير
فاطمة مهران

علي بابا كلاود تطلق نموذج لغة الرؤية الكبيرة مفتوح المصدر مع القدرة على فهم الصور

علي بابا كلاود

 أطلقت علي بابا كلاود، الشركة الرئيسية المسؤولة عن التكنولوجيا الرقمية والذكاء في مجموعة علي بابا، نموذجين مفتوحي المصدر للغة الرؤية الكبيرة Qwen-VL وQwen-VL-Chat المعدّل لغايات التحادث. ويمكن للنموذجين فهم الصور والنصوص والمربعات المحددة في الأوامر وتسهيل الإجابة على الأسئلة المتعددة باللغتين الإنجليزية والصينية.

ويعتبر Qwen-VL نسخة متعددة الأوضاع من Qwen-7B، وهو نموذج علي بابا كلاود المؤلف من 7 مليارات عامل متغير لنموذجها اللغوي الكبير Tongyi Qianwen (المتوفر أيضًا على ModelScope كمصدر مفتوح). ويستطيع Qwen-VL، القادر على فهم كل من مدخلات الصور والأوامر النصية باللغتين الإنجليزية والصينية، أداء مهام مختلفة مثل الرد على الاستعلامات المفتوحة بشأن الصور المختلفة وإنشاء تعليقات للصور.

ويقدّم Qwen-VL-Chat تفاعلاً أكثر تعقيدًا، مثل مقارنة مدخلات الصور المتعددة والإجابة على جولات متعددة من الأسئلة. وبالاستفادة من تقنيات المواءمة، يعرض مساعد الذكاء الاصطناعي مجموعة من القدرات الإبداعية، والتي تشمل كتابة الشعر والقصص بناءً على الصور المدخلة، وتلخيص محتوى الصور المتعددة، وحل الأسئلة الحسابية المعروضة في الصور.

المساهمة في المصادر المفتوحة والشمولية

في محاولة لدعم انتشار تقنيات الذكاء الاصطناعي، شاركت علي بابا كلاود كود نظام ترميز النموذج وأوزانه وبياناته الموثقة مع الأكاديميين والباحثين والمؤسسات التجارية في جميع أنحاء العالم. ويمكن الوصول إلى هذه المساهمة في مجتمع المصادر المفتوحة عبر مجتمع نماذج الذكاء الاصطناعي التابع لمجموعة علي بابا ModelScope ومنصة الذكاء الاصطناعي التعاونية Hugging Face. أما بالنسبة للاستخدامات التجارية، يمكن للشركات التي لديها أكثر من 100 مليون مستخدم نشط شهريًا طلب ترخيص من علي بابا كلاود.

ومن الممكن أن يؤدي تقديم هذه النماذج، القادرة على استخلاص المعاني والمعلومات من الصور، إلى إحداث ثورة في التفاعل مع المحتوى المرئي. فمن خلال الاستفادة من مزايا فهم الصور والقدرة على الإجابة على الأسئلة، يمكن للنماذج مثلاً تقديم المساعدة المعلوماتية للمعاقين بصريًا أثناء التسوق عبر الإنترنت في المستقبل.

وقد تم تدريب نموذج Qwen-VL مسبقًا على مجموعات بيانات الصور والنصوص. وبالمقارنة مع غيره من نماذج لغة الرؤية الكبيرة مفتوحة المصدر التي يمكنها معالجة وفهم الصور بدقة 224*224، يمكن لـ Qwen-VL التعامل مع مدخلات الصور بدقة 448*448، مما يؤدي إلى التعرف على الصور وفهمها بشكل أفضل.

واستنادًا إلى مقارنات مرجعية مختلفة، سجّل Qwen-VL أداءً متميزًا في العديد من مهام اللغة المرئية، بما في ذلك إنشاء الشروح التوضيحية، والإجابة على الأسئلة المرئية العامة، والإجابة على الأسئلة المرئية الموجهة نحو النص، واكتشاف الأشياء.

كما حقق Qwen-VL-Chat أيضًا نتائج رائدة باللغتين الصينية والإنجليزية في حوار الصور والنصوص ومستويات التوافق مع البشر، وفقًا لاختبار المقارنة المرجعية من علي بابا كلاود. وشمل هذا الاختبار أكثر من 300 صورة و800 سؤال و27 فئة.

وفي وقت سابق من هذا الشهر، قامت علي بابا كلاود بفتح مصادر نماذجها اللغوية الكبيرة المكونة من 7 مليار عامل متغير Qwen-7B وQwen-7B-Chat في إطار مساهمتها المستمرة في مجتمع المصادر المفتوحة. وقد شهد النموذجان أكثر من 400 ألف عملية تنزيل خلال شهر من إطلاقهما.

أخبار ذات صلة

“ICT Misr” راعي البنية التحتية لمعرض “Cairo ICT2025” بدعم وزارة الاتصالات من 16 إلى 19 نوفمبر الجاري

ثقة المصريين تعزز أداء ڤودافون مصر وتدفعها لتحقيق 55 مليار جنيه إيرادات في النصف الأول من العام المالي المنتهي في 30 سبتمبر 2025

طلبات مصر تطلق حملة الجمعة البيضاء بخصومات تصل إلى 70%

تعاون بين ببجي: باتل جراوندز وببجي موبايل ودار بالينسياغا لدمج تشكيلات من الأزياء الراقية في عالم الألعاب

eTax ترعى فعالية Innovation Arena خلال معرض Cairo ICT 2025 وتدعم مشروعات الذكاء الاصطناعي

WE INNOVATE تكرم الفائزين في المسابقة الوطنية للأمن السيبراني

أقوى هواتف أندرويد في 2025 تنافس آيفون 17 برو ماكس وجها لوجه

Magic 8 Ultra هاتف خارق من هونر لمنافسة أقوى الهواتف الرائدة

آخر الأخبار
وزير التربية والتعليم: نهدف لإعداد جيل قادر على الإبداع وصانع للتكنولوجيا وليس مستخدمًا لها فقط وزارة العمل تعلن عن 4202 فرصة عمل جديدة في 53 شركة بـ 14 محافظة إل جي مصر تدعم مبادرة “Better Home” لتيسير الزواج في قرى الغربية والدقهلية وزير الشباب ومحافظ الإسماعيلية يلتقيان اللجنة المؤقتة لإدارة شئون النادي الإسماعيلي بديوان المحافظة "غرينبيس: تمويل المناخ ضرورة حاسمة في أسبوع الحسم من كوب30" مدبولي: قطاع السياحة من أسهل وأسرع القطاعات التي توفر العملة الصعبة للبلاد "ICT Misr" راعي البنية التحتية لمعرض "Cairo ICT2025" بدعم وزارة الاتصالات من 16 إلى 19 نوفمبر الجاري ثقة المصريين تعزز أداء ڤودافون مصر وتدفعها لتحقيق 55 مليار جنيه إيرادات في النصف الأول من العام الما... طلبات مصر تطلق حملة الجمعة البيضاء بخصومات تصل إلى 70% رئيس مصلحة الجمارك: تتبع الشحنات لحظة بلحظة من بلد التصدير وحتى الإفراج النهائي بالمطارات "السيسي يوجه رسالة حاسمة للهيئة الوطنية للإنتخابات: الشفافية والنزاهة أساس تمثيل الشعب" محمد فريد يستعرض جهود التحول الرقمي للرقابة المالية أمام رئيس الوزراء في Cairo ICT «المركزي المصري» يستعرض أبرز إنجازات التحول الرقمي والشمول المالي خلال افتتاح مؤتمر PAFIX 2025 DMDC partners with Residual.ae to launch Dubai’s first renovate-to-resell model with US $100M villa ... تعاون بين ببجي: باتل جراوندز وببجي موبايل ودار بالينسياغا لدمج تشكيلات من الأزياء الراقية في عالم ال... أمان القابضة تُعلن عن تشكيل لجنة فتوى شرعية جديدة لتعزيز منتجاتها للتمويل الإسلامي برئاسة الدكتور مح... British Council and Partners Honour Refugee Teachers in Egypt المجلس الثقافي البريطاني وشركاؤه يكرّمون المعلّمين اللاجئين في مصر بنك saib يوقع بروتوكول تعاون مع مؤسسة بنك الشفاء المصري لتقديم الخدمات الطبية للأطفال ضعاف السمع أمان القابضة تُشكّل لجنة فتوى شرعية جديدة برئاسة د. محمد البلتاجي