كل ما تحتاج إلى معرفته عن نموذج Sora لتوليد الفيديو بالذكاء الاصطناعي
بعد انتظار طويل، أطلقت شركة (OpenAI) رسميًا نموذج (سورا) Sora، لتوليد الفيديو بالذكاء الاصطناعي، وذلك بعد تقديمه بشكل تجريبي خلال شهر فبراير 2024، ويمثل هذا الإطلاق قفزة نوعية في عالم إنشاء المحتوى، إذ يمكن لأي شخص تقريبًا إنتاج مقاطع فيديو احترافية دون الحاجة إلى مهارات تقنية متقدمة.
وقد قالت الشركة في منشور عبر مدونتها: “يتميز نموذج (Sora) بقدرته على توليد مقاطع فيديو واقعية للغاية وبدقة عالية من خلال وصف نصي، مما يمثل تقدمًا كبيرًا في محاكاة الواقع، وهو ما يُعدّ خطوة مهمة في مسيرتنا نحو تطوير نماذج ذكاء اصطناعي قادرة على فهم العالم المادي والتفاعل معه بنحو طبيعي”.
بالإضافة إلى ذلك؛ أطلقت الشركة إصدارًا جديدًا من النموذج تحت اسم (سورا توربو) Sora Turbo، الذي يتميز بسرعته العالية مقارنةً بالإصدار السابق الذي قدّمته في فبراير الماضي، ويتوفر هذا الإصدار كمنتج مستقل للمستخدمين المشتركين في ChatGPT Plus، و ChatGPT Pro.
ولكن كيف يعمل نموذج (Sora)، وما مزاياه، وكيف يمكنك الاشتراك فيه، وكيف ستتعامل OpenAI مع إساءة الاستخدام المحتملة؟.. إليك كل ما تحتاج إلى معرفته عن هذا النموذج الثوري:
أولًا؛ كيف يعمل نموذج (Sora)؟
Sora هو نموذج ذكاء اصطناعي متطور قادر على توليد مقاطع فيديو واقعية بدقة عالية بدءًا من وصف نصي، ويتميز بقدرته على إنشاء لقطات متعددة داخل مقطع فيديو واحد، مع الحفاظ على اتساق الشخصيات والأسلوب المرئي، مما يجعله أداة قوية لسرد القصص.
ولا يقتصر دور Sora على تحويل النصوص إلى مقاطع فيديو فحسب، بل يتيح للمستخدمين أيضًا إنشاء مقاطع الفيديو من الصور أو تعديل مقاطع الفيديو الموجودة بطرق مبتكرة، مثل إعادة مزجها وتعديلها وتحسينها، فعلى سبيل المثال، يمكنه إصلاح الأجزاء التالفة في مقطع فيديو أو إنشاء نهايات جديدة له.
ويتيح (Sora) إنشاء مقاطع الفيديو بدقة تصل إلى 1080 بكسلًا لمدة تصل إلى 20 ثانية، كما يمكن للمستخدمين الاختيار بين مجموعة متنوعة من نسب عرض الفيديو، بما يشمل: الشاشة العريضة (16:9)، والشاشة الرأسية (9:16)، والمربعة (1:1)، مما يوفر مرونة عالية في استخدام هذه المقاطع في مختلف المنصات والتطبيقات.
وتفتح هذه المرونة آفاقًا جديدة للإبداع وتتيح للمستخدمين إنشاء مقاطع فيديو مخصصة حسب احتياجاتهم، إذ يمكن استخدام هذا النموذج في مجموعة واسعة من المجالات، مثل صناعة الأفلام والإعلانات والتسويق والتعليم، لتوفير الوقت والجهد في إنتاج محتوى مرئي جذاب، فعلى سبيل المثال، يمكن استخدام Sora لإنشاء مقاطع فيديو ترويجية لمنتجات جديدة أو لشرح مفاهيم معقدة بشكل بسيط ومرئي.
ثانيًا، أهم مزايا هذا النموذج:
1- قدرات إنشاء الفيديو:
- تحويل النص إلى فيديو: يحول نموذج (Sora) المطالبات النصية إلى مقاطع فيديو نابضة بالحياة، وسواء كنت تريد لقطات واقعية أو مشاهد رسوم متحركة ساحرة، سيترجم أفكارك إلى حقيقة ملموسة.
- تحكم كامل في عملية الإنشاء: باستخدام مزية (إعادة المزج) Remix، يمكنك تعديل مقاطع الفيديو الموجودة، وتغيير الأسلوب أو العناصر وذلك من خلال إضافة عناصر من إنتاجك مثل الصور ومقاطع الفيديو لدمجها أو إعادة مزجها، أو من أجل إطالة مدة مقطع الفيديو.
- تنوع في دقة الفيديو وشكله: لا تقتصر إمكانيات Sora على تنسيق واحد، بل يمكنك إنشاء مقاطع فيديو بتنسيقات رأسية أو أفقية أو مربعة لتناسب أي منصة أو تطبيق، وبالإضافة إلى ذلك، يمكنك اختيار الدقة التي تناسب احتياجاتك، بدءًا من 480 بكسلًا ووصولًا إلى 1080 بكسلًا للحصول على جودة عالية.
2- مزية (Storyboarding):
سيتيح لك (Sora) تحويل أفكارك إلى قصص متحركة بسهولة بفضل مزية (Storyboarding)، فكل ما عليك فعله هو كتابة مجموعة من الجمل النصية التي تصف قصتك، وسيتولى الذكاء الاصطناعي مهمة تحويلها إلى مقاطع فيديو مترابطة، تخيل أنك ترسم قصة مصورة، ولكن باستخدام الكلمات، إذ يمكنك إنشاء قصص بسيطة أو معقدة، ابتداءً من شرح دورة الماء في الطبيعة ووصولًا إلى سرد مغامرات خيالية.
لنفترض أنك ترغب في عمل مقطع فيديو يشرح دورة الماء في الطبيعة باستخدام مزية (Storyboarding)، يمكنك بسهولة كتابة وصف نصي لسلسلة من المشاهد التي توضح العملية مثل: الماء يتبخر من بحيرة، ثم يتكثف في السحب، ويسقط في النهاية على الأرض كمطر، وسيقوم النموذج بإنشاء الفيديو تلقائيًا. وبالطريقة نفسها يمكنك إنشاء قصص مختلفة مثل قصة عن رحلة إلى القمر أو مغامرة مع حيوانك المفضل في غابة.
3- مزية (المزج) Blending:
يمتاز نموذج (Sora) بقدرة فريدة على مزج المشاهد بصورة سلسة وطبيعية، فبدلًا من مجرد ربط مقاطع الفيديو ببعضها بشكل متسلسل – كما في مزية (Storyboarding) – تعمل مزية (المزج) Blending، على إدماج مشهدين أو أكثر في انتقال واحد متجانس.
تخيل أنك ترغب في الانتقال من مشهد ليلي مظلم إلى مشهد نهاري مشرق، باستخدام هذه المزية، يمكن تحقيق هذا الانتقال بسلاسة تامة، إذ تتغير الإضاءة والظلال والحركة بشكل تدريجي ومتناسق.
أو تخيل أنك ترغب في الانتقال بسلاسة من غابة هادئة إلى مدينة مزدحمة في المستقبل، باستخدام هذه المزية، يمكنك إنشاء انتقال سلس بين المشهدين، إذ ستتحول الأشجار تدريجيًا إلى ناطحات سحاب، وتتحول الأضواء الطبيعية إلى أضواء النيون، ومن ثم تتيح لك Sora التحكم في كل التفاصيل، ابتداءً من الإضاءة والألوان ووصولًا إلى الحركة والمنظور.
4- المرشحات والأنماط الفنية:
يوفر لك Sora أيضًا مجموعة متنوعة من المرشحات والأنماط الجاهزة للاستخدام لتخصيص مقاطع الفيديو، تخيل أنك تريد تحويل مقطع فيديو عادي إلى فيلم كلاسيكي، أو ترغب في إنشاء مقطع فيديو متحرك يُشبه الرسوم المتحركة الثنائية الأبعاد، مع Sora، يمكنك تحقيق ذلك بسهولة. فقط اختر النمط الذي يناسب رؤيتك الإبداعية، وسترى كيف يتحول مقطع الفيديو إلى عمل فني.
إليك مجموعة من المرشحات والأنماط المحددة سابقًا التي يمكنك استخدامها مع مقاطع الفيديو:
- نمط (Film Noir): يتيح لك هذا النمط الحصول على مظهر سينمائي، إذ يضيف ألوانًا داكنة وتأثيرات ضوئية خاصة لإضفاء جو من الغموض والتشويق.
- نمط (Papercraft): يحول مقاطع الفيديو إلى رسوم متحركة ثنائية الأبعاد تبدو كأنها مصنوعة من الورق المقوى.
- نمط (Abstract Visuals): يصنع تأثيرات بصرية مجردة ومبتكرة باستخدام الألوان والأشكال الغريبة.
ثالثًا؛ كيفية استخدام نموذج (Sora):
أصبح نموذج (Sora) متاحًا الآن عبر موقع (Sora.com)، للمشتركين في إصداري ChatGPT Plus، و ChatGPT Pro، وبمجرد تسجيل الدخول بحسابك ستصل إلى الإصدار الأحدث من النموذج وهو (Sora Turbo)، الذي يقدم تحسينات ملحوظة في جودة الفيديو وسرعة الإنتاج مقارنة بالإصدار السابق.
ولكن بمجرد اشتراكك لا تتوقع أن تصنع أفلامًا روائية طويلة، إذ يعمل (Sora) بنظام النقاط مثل ChatGPT، و DALL-E، فكل اشتراك يمنحك عددًا محددًا من النقاط التي يمكنك استخدامها لإنشاء مقاطع الفيديو.
إذ سيحصل مستخدمو إصدار (ChatGPT Plus) على إمكانية إنشاء ما يصل إلى 50 مقطع فيديو شهريًا بدقة قدرها 480 بكسلًا أو عدد أقل من مقاطع الفيديو بدقة أعلى قدرها 720 بكسلًا.
ولكن إذا كنت ترغب في الحصول على المزيد من الخيارات، فيمكنك الاشتراك في إصدار (ChatGPT Pro) الجديد بمبلغ قدره 200 دولار شهريًا، فيمكنك إنشاء ما يصل إلى 500 مقطع فيديو، مع دقة أعلى ومدة أطول، إذ يمكنك إنشاء مقاطع فيديو تصل إلى 20 ثانية بدقة قدرها 1080 بكسلًا، مما يمنحك مرونة عالية في سرد قصصك، وستحصل أيضًا على 10 أضعاف عدد مقاطع الفيديو ذات الأولوية مقارنة بإصدار (Plus)، كما يمكنك معالجة ما يصل إلى خمسة مقاطع فيديو في وقت واحد، مما يوفر لك الوقت والجهد.
وقد أكدت شركة (OpenAI) أنها تعمل على وضع خطط تسعير جديدة مصممة لتلبية احتياجات شريحة واسعة من المستخدمين، ومن المتوقع أن تكون هذه الخطط متاحة خلال العام المقبل.
إليك خطوات إنشاء مقطع فيديو عبر (Sora):
- انتقل إلى موقع (Sora.com)، ثم سجل الدخول باستخدام بيانات حساب ChatGPT Plus أو (ChatGPT Pro).
- بمجرد تسجيل الدخول، ابحث عن زر (إنشاء) أو (فيديو جديد) وانقر عليه لفتح واجهة إنشاء الفيديو.
- اكتب وصف الفيديو الذي ترغب في إنشائه بأكبر قدر ممكن من التفصيل في مربع النص.
- اضبط إعدادات الفيديو، يمكنك اختيار نمط من الأنماط الموجودة للفيديو، وبناءً على مستوى اشتراكك، يمكنك تعيين الدقة والمدة أيضًا، ثم اضغط على زر (إنشاء)، وسيبدأ Sora بإنشاء الفيديو بناءً على طلبك.
- بمجرد أن يصبح الفيديو جاهزًا، يمكنك معاينته وإعادة إنشائه أو إدماجه في فيديو آخر من خلال كتابة طلب جديد.
وتجدر الإشارة إلى أن نموذج (Sora) لن يكون متاحًا للأشخاص الموجودين في المملكة المتحدة وأوروبا حاليًا، إذ يتطلب إطلاق Sora في هذه المناطق الامتثال لقوانين صارمة مثل: اللائحة العامة لحماية البيانات (GDPR) في الاتحاد الأوروبي، وقانون الخدمات الرقمية وقانون السلامة عبر الإنترنت في المملكة المتحدة، وتعمل OpenAI حاليًا على تلبية هذه المتطلبات القانونية لتوسيع نطاق الوصول إلى Sora في المستقبل القريب.
رابعًا؛ كيف ستتعامل OpenAI مع إساءة الاستخدام المحتملة؟
يواجه نموذج (Sora) تحديات تتعلق بجودة المحتوى وسلامته، مثل أي تقنية جديدة تعتمد على الذكاء الاصطناعي، ولضمان الاستخدام المسؤول، فرضت شركة (OpenAI) قيودًا صارمة على المحتوى الذي يمكن إنشاؤه، وتشمل هذه القيود:
- العلامات المائية: ستضاف علامة مائية مرئية على جميع مقاطع الفيديو التي يُنشئها (Sora) لمنع سوء الاستخدام.
- البيانات الوصفية: ستحتوي جميع مقاطع الفيديو التي يُنشئها (Sora) على بيانات (C2PA) الوصفية، التي تشير إلى مصدره، والتي تضمن الشفافية وتساعد في التحقق من مصدر الفيديو.
- فرض قيود على إنشاء مقاطع الفيديو: لمنع إساءة استخدام النموذج، حظرت شركة (OpenAI) توليد مواد إباحية للأطفال، ومنعت التزييف العميق الضار، كما قيدت خاصية إنشاء مقاطع مصورة تعرض أشخاصًا في البداية، إذ تقتصر عمليات رفع صور الأشخاص حاليًا على عدد محدود من المستخدمين، مع نية توسيع هذه المزية تدريجيًا بعد تحسين أدوات الحماية.