أعلنت شركة “أوبن ايه آي” الاثنين أنها أدخلت تحديثا على برنامجها للذكاء الاصطناعي “شات جي بي تي” سيجعله قادرا على التفاعل بالصوت والصورة مع المستخدمين.
وقريبا، سيتمكن البرنامج الذي اشتهر بفضله الذكاء الاصطناعي التوليدي (قدرة البرنامج على إنتاج نصوص وصور ومحتويات أخرى بناء على طلب بسيط بلغة يومية)، من الرد على أي طلب مرتبط بصورة إضافة إلى الدردشة شفهيا مع مستخدميه.
وسيتاح لهؤلاء مثلا إمكانية التقاط صورة لنصب تذكاري و”إجراء محادثة مع شات جي بي تي” عن تاريخ هذا المعلم، أو عرض المكوّنات الموجودة في ثلاجتهم عليه ليقترح عليهم وصفة ما، على ما أشارت “أوبن ايه آي” في بيان.
وعددت الشركة الناشئة استخدامات أخرى للبرنامج، منها مساعدة الأطفال على إنجاز فروضهم (من خلال التقاط صورة لمسألة رياضية مثلا) أو الطلب منه إخبارهم قصة قبل النوم.
وستدخل هذه التحديثات على “شات جي بي تي” خلال الأسبوعين المقبلين، فيما سيستفيد منها المشتركون في “شات جي بي تي بلاس”، أي النسخة المدفوعة من البرنامج، والمؤسسات المستفيدة من الخدمة.
وكانت الشركة أعلنت أنها تعتزم إجراء هذه التحديثات على البرنامج، خلال عرضها في آذار/مارس “شات جي بي تي 4″، أحدث إصدار من البرنامج.
و”شات جي بي تي 4” متعدد الوسائط، أي يمكنه معالجة بيانات أخرى غير النصوص والشيفرات.
ودفع النجاح الذي حققه “شات جي بي تي” عام 2022، شركات التكنولوجيا الكبرى من أمثال “غوغل” و”مايكروسوفت” إلى التسابق على ابتكار برامج تعمل استنادا إلى للذكاء الاصطناعي التوليدي.
لكن النشر السريع لهذه البرامج غير الخاضعة لقواعد واضحة بعد، يثير قلقا كبيرا، خصوصا وأنها تبتكر إجابات لأي سؤال يطرح عليها.
وأقرت “اوبن ايه آي” في بيانها الاثنين بأن “النماذج التي ستتمكن من معالجة الصور تمثل تحديات جديدة، لأن الأشخاص قد يستخدمون شرح الصور الذي سيقدمه البرنامج في مجالات دقيقة وتنطوي على خطورة”.
وأكدت الشركة الناشئة أنها “اختبرت النموذج” في موضوعات منها التطرف والمعرفة العلمية، مبدية تطلعها إلى استخدامه في الحياة اليومية وتلقي تعليقات من المستخدمين لتحسين أدائه .
من ناحية أخرى، حدت الشركة من قدرات “شات جي بي تي” على “تحليل الأشخاص” لأن التفاعل “لا يكون دقيقا دائما”، مشددة على أن “هذه البرامج عليها احترام خصوصية الأفراد”.
إلى ذلك، أعلنت منصة “سبوتيفاي” الاثنين عن شراكة مع “اوبن أيه آي” لترجمة البودكاست مباشرة باستخدام الذكاء الاصطناعي.
وأشارت في بيان إلى أن حلقات معروضة بالإنجليزية عبر المنصة ستكون متاحة بلغات أخرى “مع الإبقاء على الخصائص الصوتية المميزة للمتحدث”.
وأكدت الشركة السويدية أنّ تقنية توليد الصوت الجديدة من الشركة الناشئة “تستنسخ أسلوب المتحدث الأصلي، ما يتيح للمستخدم نسخة صوتية قريبة جدا من الأصلية، وواقعية أكثر من الدبلجة التقليدية”.