تكنولوجيا

إنفيديا تقدم نموذج ذكاء اصطناعي لتوليد الموسيقى والصوت من النص المكتوب

كشفت شركة إنفيديا اليوم عن نموذج ذكاء اصطناعي جديد يتيح توليد وتعديل الأصوات والموسيقى، ما يجعله أداة موجهة خصيصًا لمُنتجي الموسيقى والأفلام وألعاب الفيديو.

أوضحت إنفيديا -التي تعد من أبرز الموردين عالميًا للرقائق والبرمجيات المساعدة في بناء أنظمة الذكاء الاصطناعي- أنها لا تعتزم حاليًا إتاحة هذه التقنية للجمهور. وقد أطلقت على هذه التقنية اسم Fugatto، الذي يرمز إلى Foundational Generative Audio Transformer Opus 1.

اقرأ أيضًا:

تكنولوجيا الألعاب: كيف أحدثت تقنيات NVIDIA ثورة في عالم الألعاب؟
نموذج o1 – preview من OpenAI | هل اقتربنا من الذكاء الاصطناعي العام؟

تأتي هذه الخطوة في سياق تنافسي يشمل تقنيات مُماثلة قدمتها شركات ناشئة مثل Runway وأسماء كبيرة مثل Meta، التي تسعى أيضًا لإنتاج الصوت أو الفيديو من خلال النصوص المكتوبة.

تتميز النسخة التي طورتها إنفيديا بقدرتها على توليد تأثيرات صوتية ومقاطع موسيقية استنادًا إلى وصف نصي، بالإضافة إلى إمكانية إنشاء أصوات مُبتكرة، مثل جعل صوت المزمار يُحاكي نباح كلب.

 

الخاصية التي تمنح نموذج NVIDIA Fugatto تفردًا هي قدرتها على تعديل الصوت الحالي، مثل تحويل مقطع يُعزف على البيانو إلى مقطع يغنيه صوت بشري، أو تغيير اللهجة ومقام اللحن في تسجيلٍ صوتي.

قال برايان كاتانزارو -Bryan Catanzaro، نائب رئيس أبحاث التعلم العميق التطبيقي في إنفيديا:

إذا نظرنا إلى تطوُّر الصوت الاصطناعي خلال العقود الخمسة الماضية، نجد أن الموسيقى تغيّرت بفضل التكنولوجيا والحواسيب وأجهزة توليد الموسيقى إليكترونيًا “synthesizers”. أعتقد أن الذكاء الاصطناعي التوليدي سيوفر إمكانيات جديدة للموسيقى وألعاب الفيديو وحتى للأفراد العاديين الذين يسعون لابتكار مُحتوى إبداعي.

بينما تتفاوض شركات مثل OpenAI مع استوديوهات هوليوود حول استخدام الذكاء الاصطناعي في صناعة الترفيه، ازدادت التوترات بين التكنولوجيا وهوليوود، خاصةً بعد أن اتهمت النجمة سكارليت جوهانسون شركة OpenAI بتقليد صوتها.

دربّت NVIDIA نموذج Fugatto الجديد بالاعتماد على بيانات مفتوحة المصدر، لكنها ما زالت تبحث قرار إصداره للجمهور وكيفية القيام بذلك.

صرح كاتانزارو بأن تقنيات التوليد تنطوي على بعض المخاطر، لأنها قد تُستخدم في صناعة أشياء غير مرغوب فيها. وأكّد على أهمية الحذر، مُشيرًا إلى عدم وجود خطط فورية لإصدار النموذج.

حتى الآن، لم يجد مُبتكرو نماذج الذكاء الاصطناعي التوليدي حلول فعّالة لمنع إساءة الاستخدام، مثل إنشاء معلومات مُضللة أو انتهاك حقوق الطبع والنشر.

وبالمثل، لم تُحدّد OpenAI وMeta مواعيد مُحدّدة لإطلاق نماذجهما الخاصة بتوليد الصوت أو الفيديو للعامة.

?xml>