أعلنت “علي بابا كلاود”، التابعة لمجموعة علي بابا، أنها قامت بتوفير مصدر مفتوح للنموذجين اللغويين الكبيرين Qwen-72B وQwen-1.8B، الإصدارين المكونين من 72 مليار عامل متغير و1.8 مليار عامل متغير لنموذجها الأساسي Tongyi Qianwen، على مجتمعها الخاص بنماذج الذكاء الاصطناعي ModelScope ومنصة الذكاء الاصطناعي التعاونية Hugging Face.
بالإضافة إلى ذلك، توفر علي بابا كلاود المزيد من نماذج اللغات الكبيرة متعددة الوسائط بما فيها Qwen-Audio وQwen-Audio-Chat، نموذج فهم الصوت المدرب مسبقًا وإصدارها المحسّن للمحادثة للأغراض البحثية والتجارية.
واعتبارًا من اليوم، ساهمت الشركة الرائدة في مجال الحوسبة السحابية بأحجام مختلفة من نماذج اللغات الكبيرة ذات العوامل المتغيرة التي تتراوح من 1.8 مليار و7 مليار و14 مليار إلى 72 مليار، بالإضافة إلى نماذج اللغات الكبيرة متعددة الوسائط ذات ميزات الفهم الصوتي والمرئي.
وقال جينغرين تشو، الرئيس التنفيذي للتكنولوجيا في علي بابا كلاود: “إن بناء منظومة مفتوحة المصدر أمر بالغ الأهمية لتعزيز نماذج اللغات الكبيرة وتطوير تطبيقات الذكاء الاصطناعي. ونطمح إلى أن نصبح السحابة الأكثر انفتاحًا وأن نجعل قدرات الذكاء الاصطناعي التوليدي في متناول الجميع. ولتحقيق هذا الهدف، سنواصل مشاركة تقنياتنا المتطورة ودعم مجتمع المصادر المفتوحة مع شركائنا”.
ويتفوق النموذج المكون من 72 مليار عامل متغير، والمدرب مسبقًا على أكثر من 3 تريليون رمز، على النماذج الرئيسية الأخرى مفتوحة المصدر في عشرة معايير، ومنها معيار فهم اللغة متعدد المهام الضخم الذي يقيس دقة النموذج في أداء المهام المتعددة، ومعيار HumanEval الذي يختبر قدرات إنشاء التعليمات البرمجية، ومعيار GSM8K للمشاكل الحسابية.
ويُظهر النموذج أيضًا كفاءة في التعامل مع مجموعة متنوعة من المهام المعقدة، مثل لعب الأدوار ونقل نمط اللغة، في إشارة إلى قدرة نموذج اللغات الكبيرة على تولي دور أو شخصية معينة وإنشاء استجابات أكثر صلة بالسياق بما يتوافق مع الشخصية. وتعتبر هذه الميزات مفيدة في تطبيقات الذكاء الاصطناعي، مثل برامج الدردشة الآلية المخصصة.
ويمكن للشركات والمؤسسات البحثية الوصول إلى كود النموذج Qwen-72B وأوزان النموذج والوثائق واستخدامها مجانًا لأغراض البحث. وبالنسبة للاستخدامات التجارية، ستكون النماذج مجانية الاستخدام للشركات التي يقل عدد مستخدميها النشطين شهريًا عن 100 مليون.
وأعلنت شركة علي بابا كلاود أيضًا أنها وفرت المصدر المفتوح لنموذجها المكون من 1.8 مليار عامل متغير الذي يمكن تشغيله على الأجهزة الطرفية. ويتيح نموذج اللغات الكبيرة خفيفة الوزن الاستدلال على الأجهزة الطرفية ذات الموارد الحسابية المحدودة، مما يتيح استخدامه على الأجهزة النهائية مثل الهواتف المحمولة.
ويعتبر الإصدار الأصغر حجمًا، ذو المتطلبات الأقل لموارد الحوسبة، مفيدًا للأفراد الذين يبحثون عن خيار أسهل وأكثر فعالية من حيث التكلفة في استخدام نماذج اللغات الكبيرة. وتجدر الإشارة إلى أن النموذج المكون من 1.8 عامل متغير متاح حاليًا لأغراض البحث فقط.
ولتقديم نماذج لغوية كبيرة يمكنها معالجة مجموعة أكبر من أشكال المدخلات، أعلنت علي بابا كلاود أيضًا أنها وفرت المصدر المفتوح لكل من Qwen-Audio وQwen-Audio-Chat، وهما النموذجان اللذان يتمتعان بقدرات محسنة لفهم الصوت للأغراض البحثية والتجارية.
ويستطيع Qwen-Audio فهم مدخلات النص والصوت بأشكال متنوعة، بما في ذلك الكلام البشري والصوت الطبيعي والموسيقى، وإنتاج مخرجات نصية. وهو قادر على أداء أكثر من 30 مهمة معالجة صوتية، مثل التدوين متعدد اللغات، وتحرير الكلام، وتحليل الشروح الصوتية الخ. ويمكن لإصداره المحسّن للمحادثة، Qwen-Audio-Chat، دعم جولات متعددة من الأسئلة والأجوبة استنادًا إلى الصوت وأداء مهام صوتية متنوعة، مثل اكتشاف العواطف والنبرات في الخطابات البشرية.
وتمثل هذه المبادرة محاولة أخرى من علي بابا كلاود لتزويد مجتمع المصادر المفتوحة بنماذج لغوية كبيرة متعددة الوسائط يمكنها فهم أنواع البيانات غير النصية. وفي وقت سابق من هذا العام، أعلنت الشركة عن إطلاق نموذج لغة الرؤية الكبيرة مفتوح المصدر Qwen-VL وإصداره الخاص بالدردشة Qwen-VL-Chat الذي يمكنه فهم المعلومات المرئية وتنفيذ المهام المرئية.
ومنذ شهر أغسطس، سجلت نماذج اللغات الكبيرة مفتوحة المصدر، بما في ذلك Qwen-7B وQwen-14B وQwen-VL وإصداراتها المحسّنة لغايات المحادثة، ما مجموعه 1.5 مليون عملية تنزيل على مجتمع نماذج الذكاء الاصطناعي مفتوح المصدر التابع لـشركة علي بابا كلاود ModelScope وHugging Face. كما أصبح ModelScope أكبر مجتمع لنماذج الذكاء الاصطناعي في الصين، حيث يضم أكثر من 2.8 مليون مطوّر نشط، وقد شهد أكثر من 100 مليون عملية تنزيل للنماذج حتى الآن.