ميسترال تطرح نموذجها المتعدد الوسائط Pixtral 12B
تخوض ميسترال مجال الوسائط المتعددة، إذ أطلقت شركة الذكاء الاصطناعي الفرنسية الناشئة Pixtral 12B، وهو أول نماذجها المتعددة الوسائط مع إمكانيات معالجة اللغة والرؤية.
ولا يتاح النموذج عبر شبكة الإنترنت العامة في الوقت الحالي، مع أنه من الممكن تنزيل التعليمات البرمجية المصدرية للنموذج من Hugging Face أو GitHub للاختبار عبر حالات فردية.
وخالفت الشركة الناشئة مرة أخرى الاتجاه النموذجي لإصدار نماذج الذكاء الاصطناعي من خلال توفير رابط تورنت لتنزيل ملفات النموذج الجديد.
وأشارت صوفيا يانج، رئيسة علاقات المطورين في الشركة، في منشور عبر إكس إلى أن الشركة تخطط لتوفير النموذج قريبًا من خلال منصة روبوت الدردشة Le Chat، مما يسمح للمطورين المحتملين بتجربته.
كما أنه قادم أيضًا عبر منصة La Platforme التابعة لشركة ميسترال، التي توفر واجهة برمجة تطبيقات لاستخدام نماذج الشركة.
يمتاز نموذج Pixtral 12B بقدرته الفريدة على دمج تحليل الصور مع معالجة اللغة الطبيعية، مما يتيح للمستخدمين طرح أسئلة مباشرة على الصور. وبذلك، يمكن للمستخدمين تحميل صورة أو مشاركة رابط لها والحصول على إجابات مفصلة حول محتواها. تمثل هذه الميزة خطوة رائدة في مجال الذكاء الاصطناعي، إذ تجمع بين فهم الصور واللغة بطريقة مبتكرة.
إن Pixtral 12B يميز نفسه بقدراته المتقدمة في الربط بين النصوص والصور، مع وجود نماذج أخرى قادرة على معالجة الصور.
ويحتوي نموذج Pixtral 12B على 12 مليار معلمة فريدة، ويدعم ضمنيًا عددًا عشوائيًا من الصور ذات الأحجام العشوائية.
ويستطيع Pixtral 12B أداء مهام، مثل توفير تعليقات توضيحية للصور وحساب عدد الكائنات في الصورة.
ومع إطلاق Pixtral 12B، تعزز ميسترال إمكانية الوصول إلى الاستخدامات المرئية، مثل تحليل المحتوى والبيانات.
ومنذ إطلاقها العام الماضي، لم تكتف ميسترال ببناء نماذج تتنافس مع مختبرات الذكاء الاصطناعي الرائدة، مثل OpenAI، بل دخلت أيضًا شراكة مع عمالقة الصناعة، مثل مايكروسوفت وأمازون، لتوسيع نطاق تقنيتها.
وقبل بضعة أشهر، جمعت ما يصل إلى 640 مليون دولار بتقييم قدره 6 مليارات دولار، وتبع ذلك إطلاق Large 2، وهو نموذج من فئة GPT-4 يتمتع بإمكانيات متقدمة فيما يتعلق باللغات المتعددة والأداء المحسّن في الاستدلال وتوليد التعليمات البرمجية والرياضيات.
كما أصدرت نموذج Mixtral 8x22B، ونموذج البرمجة Codestral، إلى جانب نموذج مخصص للتفكير المتعلق بالرياضيات والاكتشاف العلمي.
وتقدم الشركة بعض نماذجها المفتوحة المصدر بموجب ترخيص Apache 2.0 دون قيود. وفيما يتعلق بالنماذج الأخرى، تقدم ميسترال ترخيصًا مجانيًا للتطوير والاستخدامات البحثية والأكاديمية، مع أنه يتطلب ترخيصًا مدفوعًا للاستخدامات التجارية.
We dropped a new model – Pixtral 12B, our first-ever multimodal model. Enjoy! 🥰🎉 https://t.co/uvXnpJf6mQ
— Sophia Yang, Ph.D. (@sophiamyang) September 11, 2024