تكنولوجيا

شركة OpenAI تضيف فهم الفيديو إلى وضع الصوت المتقدم في ChatGPT

أعلنت OpenAI أخيرًا عن توفير ميزة الفيديو بالوقت الفعلي في ChatGPT، التي كانت قد كشفت عنها قبل قرابة 7 أشهر. أوضحت الشركة أن ميزة “Advanced Voice Mode” للدردشات الشبيهة بالإنسان أصبحت الآن تدعم الرؤية.

يمكن للمُستخدمين المُشتركين في خطط (اشتراك) ChatGPT Plus أو Team أو Pro توجيه هواتفهم نحو أشياءٍ مُعينة، ليتمكن ChatGPT من التفاعل معها والاستجابة بشكل شبه فوري.

اقرأ أيضًا:

بين المجانية والربحية – رحلة OpenAI نحو المستقبل

إطلاق نموذج Sora لتوليد الفيديوهات | بداية عصر جديد من المحتوى المرئي

الميزة الجديدة “Advanced Voice Mode” مع خاصية الرؤية تتيح أيضًا تحليل المُحتوى على شاشة الجهاز من خلال مُشاركة الشاشة. على سبيل المثال، يمكنها شرح القوائم والإعدادات المُختلفة أو تقديم حلول وتعليقات لمشاكل رياضية.

للاستفادة من هذه الميزة، يمكن للمُستخدم الضغط على رمز الصوت بجوار شريط الدردشة، ثم الضغط على أيقونة الفيديو في الزاوية السُفلية اليُسرى لبدء الفيديو. وإذا أراد مُشاركة الشاشة، عليه اختيار قائمة النقاط الثلاث ومن ثم تحديد مشاركة الشاشة “Share Screen”.

بدأ طرح الميزة اليوم وسيكتمل خلال الأسبوع القادم، ولكن سيكون مُتاحًا فقط لفئة مُعينة من المستخدمين. فعلى سبيل المثال، لن يتمكن مُشتركو ChatGPT Enterprise وEdu من الوصول إليها قبل يناير.

في عرض قدمته OpenAI مؤخرًا على قناة CNN، أظهر جريج بروكمان، رئيس OpenAI، اختبارًا عمليًا لهذه التقنية مع أندرسون كوبر. وخلال العرض التوضيحي، قام كوبر برسم أجزاء من الجسم على السبورة بينما كان ChatGPT “يفهم” ما يرسمه. وقدّم ملاحظات عن الرسومات قائلاً: “الموقع دقيق جدًا. العقل موجود هناك في الرأس، والشكل بداية جيدة لكنه يشبه الشكل البيضاوي”.

لكن خلال نفس العرض التوضيحي ارتبك النظام في حل مشكلة هندسية، مما يبرز احتمال تعرضه لأخطاء أو ما يُعرف بـ”الهلوسة”.

تأخر إطلاق خاصية “Advanced Voice Mode” مع الرؤية عدة مرات، ويُقال إن السبب جزئيًا يعود للإعلان المُبكر عن الميزة قبل أن تصبح جاهزة للإنتاج. حيث وعدت الشركة في أبريل بأنها ستطرح الميزة خلال “أسابيع قليلة”، لكنها لاحقًا صرّحت بأنها تحتاج إلى مزيد من الوقت.

في الخريف الماضي، وصلت خاصية Advanced Voice Mode لبعض المُستخدمين ولكن دون عنصر التحليل البصري.

في ظل المُنافسة المُتزايدة، تعمل شركات أخرى مثل جوجل وMeta على تطوير ميزات مُشابهة خاصة بتطبيقات الدردشة التابعة لها. وقد طرحت Google مؤخرًا ميزة مُشابهة للذكاء الاصطناعي لتحليل الفيديو والمُحادثات الفورية عبر مشروعها المعروف باسم Project Astra لمجموعة مُختارة من المُختبرين الموثوقين على نظام أندرويد.

?xml>