تكنولوجيا

شركة OpenAI تعلن عن نماذج o3 و o3-mini الاستدلالية وتطرحها قريبًا

تدعو شركة OpenAI مستخدمين مُحددين لاختبار نماذجها الجديدة للاستدلال، OpenAI o3 وo3-mini -الإصدارات الجديدة من o1 وo1-mini، والتي تم أُعلن عنها خلال اليوم الأخير من البث المُباشر لحدث “12 يومًا من OpenAI”.

كشف الرئيس التنفيذي سام ألتمان أن هذه النماذج ستخضع في البداية لاختبارات السلامة من قبل باحثين من جهات خارجية، ومن المتوقع أن يُطلق o3-mini بحلول يناير 2025 وo3 بعد ذلك بفترة قصيرة.

اقرأ أيضًا:

بين المجانية والربحية – رحلة OpenAI نحو المستقبل

ما هو الذكاء الاصطناعي، كيف يعمل؟ وهل يهدد البشرية

أكّد ألتمان على إمكانات النماذج في مُعالجة مهام الاستدلال المُعقدّة، والذي يُمثّل مرحلة جديدة في تطوير الذكاء الاصطناعي. يتزامن الإعلان مع إطلاق جوجل لنموذج Gemini 2.0 Flash Thinking، ممّا يُسلّط الضوء على المُنافسة الشرسة في نماذج الاستدلال المُتقدمة في مجالات مثل العلوم والتكنولوجيا.

يتفوق نموذج OpenAI o3 في معايير الأداء، مُتفوقًا على o1 في مهام البرمجة والرياضيات والعلوم:

  • البرمجة: يسجل درجات أعلى بنسبة 22.8⁒ في SWE-Bench Verified ويُحقّق تصنيف Codeforces 2727.
  • الرياضيات/ العلوم: يسجل 96.7⁒ في AIME 2024 و87.7⁒ في GPQA Diamond.
  • الاستدلال المفاهيمي: يُحطّم الأرقام القياسية في اختبارات مثل Frontier Math وARC-AGI من EpochAI.

كما قدّمت OpenAI المُحاذاة التداولية “deliberative alignment”، والتي تتضمّن مواصفات السلامة المكتوبة بواسطة الإنسان مُباشرةً في النماذج لتحسين السلامة والحد من النتائج الضارة.

يدعم هذا النظام الاستدلال المُتسلسل، مُتجاوزًا الأساليب السابقة مثل RLHF. تُظهر الأبحاث تقدمًا كبيرًا في مُقاومة عمليات كسر الحماية، والتعامل مع المُطالبات والاستفسارات غير الخطرة، والتعميم عبر سيناريوهات متنوعة.

 

تظل طلبات اختبار o3 وo3-mini مفتوحة حتى 10 يناير 2025. ويجب على المُتقدمين تقديم تفاصيل عن العمل السابق، واستخدامهم المقصود للنماذج، وسيساعدون في تقييم السلامة والقدرات. تسعى مبادرة OpenAI إلى ضمان تطوير هذه النماذج القوية بشكل مسؤول من خلال التعاون مع مُجتمع البحث الأوسع.

يمثّل إصدار OpenAI o3 وo3-mini قفزة إلى الأمام في قدرة الذكاء الاصطناعي على حل المشكلات المُتقدمة، والذي يُمهّد الطريق لمزيد من التقدم في التفكير والسلامة.

?xml>