“علي بابا” تطلق نموذج ذكاء اصطناعي يمكنه معالجة الفيديو والصوت على الهاتف

أطلقت مجموعة علي بابا القابضة نموذج ذكاء اصطناعي جديدا ضمن سلسلة “Qwen”، تقول الشركة إنه قادر على معالجة النصوص والصور والصوت والفيديو، ويتمتع بكفاءة بما يكفي لتشغيله مباشرةً على الهواتف الذكية وأجهزة الكمبيوتر المحمولة.
وأضافت الشركة أنها تتوقع أن يُستخدم النموذج الجديد لبناء ما يُسمى بوكلاء الذكاء الاصطناعي الذين يمكنهم، على سبيل المثال، مساعدة الأشخاص ذوي الإعاقة البصرية على التنقل في بيئتهم من خلال أوصاف صوتية لحظية.
ويحمل النموذج الجديد، الذي أُطلق يوم الأربعاء، اسم “Qwen2.5-Omni-7B”، بحسب وكالة بلومبرغ.
والنموذج الجديد هو نموذج متعدد الوسائط، مما يعني أن بإمكانه معالجة المدخلات بما في ذلك النصوص، والصور، والصوت والفيديو، بينما يقوم بتوليد نصوص وردود فعل صوتية طبيعية فورية.
وأتاحت “علي بابا” النموذج الجديد مفتوح المصدر على منصتي “Hugging Face” و”GitHub”، لتتبع بذلك اتجاهًا متزايدًا في الصين بشأن النماذج مفتوحة المصدر اقتداء بشركة ديب سيك، التي جعلت نموذجها الرائد “R1” مفتوح المصدر.
ويشير مصطلح “مفتوح المصدر” عمومًا إلى البرامج التي تُتاح شفرتها المصدرية مجانًا على الإنترنت للتعديل وإعادة التوزيع.
وفي ظل منافسة محتدمة في الذكاء الاصطناعي في الصين، والتي تسارعت بفضل شركة ديب سيك الناشئة، أطلقت “علي بابا” وغيرها من المنافسين في مجال الذكاء الاصطناعي التوليدي نماذج ومنتجات جديدة وفعالة من حيث التكلفة بوتيرة غير مسبوقة، بحسب تقرير لشبكة “CNBC”.
والأسبوع الماضي، أصدرت شركة التكنولوجيا الصينية العملاقة “بايدو” نموذجًا أساسيًا جديدًا متعدد الوسائط وأول نموذج لها يركز على التفكير.
وفي غضون ذلك، أطلقت “علي بابا” نموذج الذكاء الاصطناعي “Qwen 2.5” المُحدّث في أواخر يناير، وأطلقت إصدارًا جديدًا من أداة المساعد الذكي “Quark” في وقت سابق من هذا الشهر.
وقد التزمت الشركة بقوة باستراتيجيتها الخاصة بالذكاء الاصطناعي، حيث أعلنت الشهر الماضي عن خطة لاستثمار 53 مليار دولار في البنية التحتية للحوسبة السحابية والذكاء الاصطناعي على مدى السنوات الثلاث المقبلة، وهو ما يتجاوز ما أنفقته في هذا المجال على مدى العقد الماضي.