الرئيس التنفيذي
أشرف الحادي

رئيس التحرير
فاطمة مهران

علي بابا كلاود تطلق نموذج لغة الرؤية الكبيرة مفتوح المصدر مع القدرة على فهم الصور

علي بابا كلاود

 أطلقت علي بابا كلاود، الشركة الرئيسية المسؤولة عن التكنولوجيا الرقمية والذكاء في مجموعة علي بابا، نموذجين مفتوحي المصدر للغة الرؤية الكبيرة Qwen-VL وQwen-VL-Chat المعدّل لغايات التحادث. ويمكن للنموذجين فهم الصور والنصوص والمربعات المحددة في الأوامر وتسهيل الإجابة على الأسئلة المتعددة باللغتين الإنجليزية والصينية.

ويعتبر Qwen-VL نسخة متعددة الأوضاع من Qwen-7B، وهو نموذج علي بابا كلاود المؤلف من 7 مليارات عامل متغير لنموذجها اللغوي الكبير Tongyi Qianwen (المتوفر أيضًا على ModelScope كمصدر مفتوح). ويستطيع Qwen-VL، القادر على فهم كل من مدخلات الصور والأوامر النصية باللغتين الإنجليزية والصينية، أداء مهام مختلفة مثل الرد على الاستعلامات المفتوحة بشأن الصور المختلفة وإنشاء تعليقات للصور.

ويقدّم Qwen-VL-Chat تفاعلاً أكثر تعقيدًا، مثل مقارنة مدخلات الصور المتعددة والإجابة على جولات متعددة من الأسئلة. وبالاستفادة من تقنيات المواءمة، يعرض مساعد الذكاء الاصطناعي مجموعة من القدرات الإبداعية، والتي تشمل كتابة الشعر والقصص بناءً على الصور المدخلة، وتلخيص محتوى الصور المتعددة، وحل الأسئلة الحسابية المعروضة في الصور.

المساهمة في المصادر المفتوحة والشمولية

في محاولة لدعم انتشار تقنيات الذكاء الاصطناعي، شاركت علي بابا كلاود كود نظام ترميز النموذج وأوزانه وبياناته الموثقة مع الأكاديميين والباحثين والمؤسسات التجارية في جميع أنحاء العالم. ويمكن الوصول إلى هذه المساهمة في مجتمع المصادر المفتوحة عبر مجتمع نماذج الذكاء الاصطناعي التابع لمجموعة علي بابا ModelScope ومنصة الذكاء الاصطناعي التعاونية Hugging Face. أما بالنسبة للاستخدامات التجارية، يمكن للشركات التي لديها أكثر من 100 مليون مستخدم نشط شهريًا طلب ترخيص من علي بابا كلاود.

ومن الممكن أن يؤدي تقديم هذه النماذج، القادرة على استخلاص المعاني والمعلومات من الصور، إلى إحداث ثورة في التفاعل مع المحتوى المرئي. فمن خلال الاستفادة من مزايا فهم الصور والقدرة على الإجابة على الأسئلة، يمكن للنماذج مثلاً تقديم المساعدة المعلوماتية للمعاقين بصريًا أثناء التسوق عبر الإنترنت في المستقبل.

وقد تم تدريب نموذج Qwen-VL مسبقًا على مجموعات بيانات الصور والنصوص. وبالمقارنة مع غيره من نماذج لغة الرؤية الكبيرة مفتوحة المصدر التي يمكنها معالجة وفهم الصور بدقة 224*224، يمكن لـ Qwen-VL التعامل مع مدخلات الصور بدقة 448*448، مما يؤدي إلى التعرف على الصور وفهمها بشكل أفضل.

واستنادًا إلى مقارنات مرجعية مختلفة، سجّل Qwen-VL أداءً متميزًا في العديد من مهام اللغة المرئية، بما في ذلك إنشاء الشروح التوضيحية، والإجابة على الأسئلة المرئية العامة، والإجابة على الأسئلة المرئية الموجهة نحو النص، واكتشاف الأشياء.

كما حقق Qwen-VL-Chat أيضًا نتائج رائدة باللغتين الصينية والإنجليزية في حوار الصور والنصوص ومستويات التوافق مع البشر، وفقًا لاختبار المقارنة المرجعية من علي بابا كلاود. وشمل هذا الاختبار أكثر من 300 صورة و800 سؤال و27 فئة.

وفي وقت سابق من هذا الشهر، قامت علي بابا كلاود بفتح مصادر نماذجها اللغوية الكبيرة المكونة من 7 مليار عامل متغير Qwen-7B وQwen-7B-Chat في إطار مساهمتها المستمرة في مجتمع المصادر المفتوحة. وقد شهد النموذجان أكثر من 400 ألف عملية تنزيل خلال شهر من إطلاقهما.

أخبار ذات صلة

مواصفات هاتف xiaomi redmi k90 pro max الرسمي وموعد الإطلاق المتوقع

مواصفات هاتف Oppo Reno15 Pro Max وأسعاره الرسمية في السعودية

xiaomi 17 pro max: المواصفات الكاملة قبل الإطلاق الرسمي 2025

فودافون كاش

رسوم السحب على فودافون كاش 2025 بعد التحديث الرسمي

دعاء القصاص رئيساً تنفيذياً لقطاع الأعمال في “ICT Misr” بخبرات تتخطى 20 عاماً

جيل جديد من سماعات الأذن اللاسلكية المزودة بخاصية إلغاء الضوضاء قريبًا في مصر

HUAWEI FreeBuds 7i: A new generation of noise-cancelling wireless earphones Soon in Egypt

خبير تكنولوجيا: الوقت حان لتوحيد صوت شركات التكنولوجيا لتكون شريكًا في صنع القرار

آخر الأخبار
طريقة حل الواجبات عبر منصة مدرستي خطوة بخطوة للطلاب وأولياء الأمور مواصفات هاتف xiaomi redmi k90 pro max الرسمي وموعد الإطلاق المتوقع أسعار تذاكر المتحف المصري الكبير 2025 والفئات المعفاة من الرسوم تفاصيل مشروع بيتك في مصر 2025 وخطط الحجز والتقديم والسداد بالتقسيط موعد التقديم على مشروعات التخرج الريادية 2025 للجامعات السعودية وشروط القبول سعر فولكس فاجن تايرون 2026 في السعودية ومواصفاتها الكاملة رسميًا أبو مازن يشكر الرئيس السيسي لمنعه التهجير ودعم صمود الفلسطينيين وظائف المطابع الأميرية 2025: الشروط والتخصصات المطلوبة وطريقة التقديم أسعار استخراج جواز سفر 2025 في السعودية وشروط التقديم والرسوم الرسمية مواصفات هاتف Oppo Reno15 Pro Max وأسعاره الرسمية في السعودية مواصفات سيارة سوزوكي بالينو 2026 الرسمية والتحديثات الجديدة في التصميم والأداء فحص اللياقة المهنية في السعودية: الشروط وطريقة الحجز والخطوات بالتفصيل جدول مواعيد صرف الرواتب 2025 السعودية للقطاعين الحكومي والخاص سفير مصر في رام الله يلتقي رئيس دولة فلسطين هيلتون خطط تطوير متنامية بقيمة 8 مليارات دولار تمثل استثمارات المُلّاك المشتركة فى السعودية برئاسة وزير البترول.. اجتماع أعضاء اللجنة العليا لمؤتمر ومعرض إيجبس 2026 جمارك مطار الغردقة الدولي تضبط محاولة تهريب كمية من مخدر الحشيش القابضة للمطارات تشارك في الاجتماع السنوي والجمعية العامة لACI World مدبولي: بدون مشروعات البنية الأساسية لم تستطيع المنطقة الاقتصادية جذب استثمار خارجي بـ 11 مليار دولا... وزارة التعاون الدولي توفر كافة أوجه الدعم لإتمام انتخابات نادي الزهور