تكنولوجيا

شركة OpenaI تُطلق gpt-realtime | نهاية مراكز خدمة العملاء؟

  • gpt-realtime يقدم محادثات صوتية فورية طبيعية تتجاوز تحويل الكلام إلى نص.
  • يدعم بروتوكول MCP لربط الخدمات الخارجية بسهولة وسرعة دون تكاملات مخصّصة.
  • يتيح استقبال صور ولقطات شاشة وتحليلها أثناء المحادثة.
  • التقنية تهدد مراكز الكول سنتر التقليدية وتعيد تشكيل أدوار الموظفين.

في خطوة جديدة قد تغيّر شكل المحادثات الرقمية كما نعرفها، أعلنت شركة «أوبن أي آي» عن إطلاق نموذج صوتي جديد يحمل اسم gpt-realtime أو «جي-بي-تي الفوري»، وهو نظام قادر على الاستماع والرد بالصوت في اللحظة نفسها، من دون المرور بمراحل معقدة لتحويل الكلام إلى نص ثم إعادة توليده كصوت. الفكرة ببساطة أن النموذج نفسه يستقبل صوتك ويجيبك مباشرة، بصوت طبيعي يحافظ على نبرة الحديث وتفاصيله، بل ويدمج لغات مختلفة داخل الجملة الواحدة.

ما الذي يعنيه هذا للمستخدم العادي؟ إذا جرّبت من قبل التواصل مع مساعد افتراضي عبر الهاتف أو خدمة دعم آلي، فأنت تعرف جيدًا ذلك الصوت الميكانيكي البارد الذي يجعلك تتمنى لو تحدثت مع موظف حقيقي. gpt-realtime يعد بإنهاء هذه المعاناة. الأصوات الجديدة تبدو أكثر إنسانية، قادرة على التقاط الإشارات غير اللفظية، بل وحتى الالتزام بنصوص دقيقة عندما يكون المطلوب تلاوة أرقام أو أكواد.

هناك نقطة تقنية مهمّة أيضًا للمطورين: دعم «بروتوكول سياق النموذج» (MCP) و الذي يعتبر المقابل للـ API في عالم الذكاء الاصطناعي. ببساطة، يسمح هذا البروتوكول بتوصيل الوكيل الصوتي بخوادم أدوات خارجية عن بُعد ليصل إلى خدمات وبيانات إضافية من دون بناء تكاملات مخصّصة لكل خدمة. يكفي الإشارة إلى خادم MCP مناسب حتى تصبح أدواته (مثل أنظمة الفوترة والدفع، منصّات إدارة التذاكر، قواعد المعرفة الداخلية، أو مخازن المنتجات) متاحة فورًا داخل الجلسة، مع إمكان ضبط سياسات التفويض والمراجعة. والأهم أنّ تبديل خادم MCP يضيف قدرات جديدة للوكيل من دون تغييرات كبيرة على الكود ما يسرّع التجريب والإطلاق في بيئات الإنتاج.

الأمر لا يتوقف عند الصوت فقط. النموذج أصبح قادرًا على استقبال صور ولقطات شاشة أثناء المحادثة. تخيّل أن تتصل بخدمة الدعم وتقول: “هاتفي يعرض هذه الرسالة، ماذا تعني؟” ثم ترسل صورة الشاشة، ليحللها المساعد ويعطيك الجواب فورًا. 

أضف إلى ذلك قدرة الربط المباشر مع شبكات الهاتف التقليدية، مما يعني أن وكلاء الذكاء الاصطناعي يمكنهم فعليًا أن يردوا على مكالماتك الهاتفية كما يفعل الموظفون اليوم.

مراكز خدمة العملاء على المحك

بالطبع، هذه التطورات ليست مجرد تحسينات تقنية. السؤال الكبير هنا: ماذا سيحدث لمراكز الكول سنتر؟ هذه المراكز التي تضم مئات الآلاف حول العالم قائمة على جيش من الموظفين يتولون الرد على الاستفسارات المتكررة. الآن، مع نموذج صوتي أسرع وأرخص وأكثر دقة، قد تجد الشركات أن الاعتماد على الذكاء الاصطناعي حل اقتصادي أفضل بكثير.

لكن الصورة ليست سوداء بالكامل. صحيح أن كثيرًا من المهام الروتينية قد تنتقل إلى الذكاء الاصطناعي، إلا أن ذلك قد يفتح الباب لأدوار جديدة تركز على حل المشكلات المعقدة التي لا يستطيع الروبوت معالجتها بسهولة، أو على مراقبة جودة هذه النظم وضبطها. فالمعادلة هنا ليست “إلغاء وظائف”، بل إعادة تشكيلها.

ومع تخفيض الأسعار بنحو 20%، واتساع نطاق الإتاحة لجميع المطورين، يبدو أن «أوبن أي آي» تراهن على جعل هذه التقنية في متناول أي شركة، من مؤسسات عملاقة إلى مشاريع ناشئة. المستخدم العادي قد يراها بداية لمحادثات هاتفية أكثر سلاسة وإنسانية، أما سوق العمل فقد يراها جرس إنذار أو فرصة لإعادة الابتكار.

الآن يبقى السؤال: هل نحن على أعتاب نهاية مراكز خدمة العملاء كما نعرفها، أم أن هذه المراكز ستتطور وتجد لنفسها دورًا جديدًا في عالم يحكمه الذكاء الاصطناعي الصوتي؟

?xml>