عندما بدأ المخرج الأيرلندي رويري روبنسون في تحميل سلسلة من المقاطع القصيرة التي تم إنشاؤها باستخدام Seedance 2.0 – مطور TikTok أحدث نموذج لتوليد الفيديو من ByteDance – كان من الصعب إنكار أن اللقطات كانت أكثر إثارة للإعجاب مما رأيناه من مجموعات الذكاء الاصطناعي الأخرى. بدا نجم المقاطع (نسخة رقمية من توم كروز) يشبه إلى حد كبير الشيء الحقيقي حيث كان يقاتل براد بيت والروبوتات البشرية والزومبي. وكانت الشخصيات تتحرك بسلاسة معقدة تكاد تكون بمثابة تصميم الرقصات ويتم تضخيمها من خلال “الكاميرا” الحركية.
يحب المتحمسون لجيل الذكاء الاصطناعي أن يعلنوا أن صناعة الترفيه المنتجة تقليديًا تم طبخها، ويبدو أن بعض أكبر استوديوهات هوليوود منزعجة من قدرات Seedance الأخيرة مع استمرار مقاطع الفيديو المصطنعة-Cruise في زيادة المشاهدات عبر الإنترنت. جمعية الصور المتحركة, ديزني، باراماونت، و نيتفليكس أرسلت كل شركة ByteDance خطابات إيقاف وكف بشأن ادعاءات انتهاك حقوق الطبع والنشر. و ردا على ذلك، قال بايت دانس أنها ستتخذ خطوات “لتعزيز الضمانات الحالية بينما نعمل على منع الاستخدام غير المصرح به للملكية الفكرية وما شابه ذلك من قبل المستخدمين”. لم تصدر ByteDance رسميًا بعد إصدارًا من Seedance يمنع المستخدمين من إنشاء لقطات لا تملك الشركة حقوق إنشائها.
كل شيء عن طرح Seedance 2.0 موجود شعرت وكأنها حيلة فيروسية، خاصةً عندما أوضحت الاستوديوهات بالفعل أنها كذلك على استعداد لرفع دعوى قضائية عندما تسرق شركات الذكاء الاصطناعي الملكية الفكرية الخاصة بها. صحيح أن مقاطع الفيديو التي أنشأتها Seedance تبدو أفضل بكثير من الكثير من الأشياء التي رأيناها مصنوعة باستخدام Sora وVeo وRunway وغيرهم. لكن حقيقة أن إنتاج نسخ مصقولة للغاية هو السبب الرئيسي وراء الشهرة للنموذج الجديد يجعل Seedance 2.0 مجرد مولد آخر للإنحراف – وإن كان أكثر روعة.
عندما نشير إلى فيديو الذكاء الاصطناعي العام على أنه “منحدر”، فإننا عادةً ما نعلق على الجماليات والعرض التقديمي. لكن الوسائل التي يتم من خلالها إنشاء لقطات الذكاء الاصطناعي هي جزء مهم من المعادلة. على عكس الأفلام والعروض ومقاطع الفيديو عبر الإنترنت المنتجة تقليديًا – والتي يمكن أن تكون كذلك بشكل قذر وضعت – تعتبر الأشياء المصنوعة باستخدام الذكاء الاصطناعي “غير متقنة” لأنها نتاج سير عمل خالٍ من أي نية تأليفية أو فنية مباشرة. على عكس فريق من صانعي الأفلام من البشر، لا يمكن لنموذج فيديو الذكاء الاصطناعي العام أن يتبع دائمًا إيقاعات القصة أو دوافع الشخصية، ولكنه يمكنه تحليل مدخلات بسيطة وإنشاء مخرجات يبدو مستنيرًا بالسرد (إذا كنت حولًا) لأن البرنامج قد تم تدريبه على كميات هائلة من البيانات المرئية.
في جوهره، Seedance لا يختلف كثيرًا عن أقرانه
إن القدرة على تقليد الشيء الحقيقي (اقرأ: من صنع البشر) هو الهدف الأساسي لمشاريع مثل Seedance 2.0، لكن النماذج لا يمكنها فعل ذلك ما لم يتم إعطاؤها أولاً قدرًا وافرًا من المواد المصدرية للتكرار عليها برمجيًا. ومن خلال السماح بمثل هذا الانتهاك الصارخ للملكية الفكرية، أخبرتنا ByteDance أنه – بصرف النظر عن لقطات الحركة الأكثر حيوية وتصميم الصوت الأقوى – في جوهرها، لا تختلف Seedance كثيرًا عن نظيراتها. لقد كان من السهل التعرف على Seedance 2.0 كمولد سلوب عندما تنظر إلى المقاطع الأكثر انتشارًا التي تم إنشاؤها باستخدام البرنامج، والتي تميل إلى إبراز المشاهير من القائمة الأولى وشخصيات خيالية محمية بحقوق الطبع والنشر بشكل واضح. لكن الخدعة في كل ذلك أصعب بكثير عندما تشاهد فيلم المخرج الصيني جيا تشانغكي رقصة جيا تشانغكي، فيلم قصير تم إنتاجه بواسطة Seedance 2.0 ويظهر فيه Zhangke إجراء نقاش حول طبيعة الإبداع مع نسخة الذكاء الاصطناعي منه.
رقصة جيا تشانغكي يتم الانتقال إلى Meta حيث تناقش شخصيتان ما إذا كان ينبغي اعتبار الأفلام التي تم إنشاؤها باستخدام الذكاء الاصطناعي نسخًا مجمعة لأعمال من صنع الإنسان أو نوع جديد من أشكال الفن. بعد أن كشف أحد أعضاء Jias عن نفسه على أنه نسخة من الذكاء الاصطناعي للآخر، يتبعهما الفيلم القصير على ملف مصفوفةرحلة تشبه الرحلة عبر إعدادات مختلفة تهدف إلى إظهار قدرة الذكاء الاصطناعي على استحضار أي صور يمكن أن يفكر فيها المحفز. رقصة جيا تشانغكي تتكشف بسلاسة وتماسك سردي سيكون من الصعب عليك العثور على التمرير خلاله تطبيق Sora من OpenAI. ولكن عندما تنظر عن كثب إلى ما يحدث في خلفية المشاهد القصيرة الأكثر انشغالًا والتي تتضمن شخصيات في الخلفية، فليس من الصعب رؤية Seedance 2.0 يرتكب بعض أخطاء الاستمرارية نفسها التي ابتليت بها جميع مولدات الفيديو.
رقصة جيا تشانغكي يعد هذا مثالًا ساطعًا على كيفية قيام صانعي الأفلام بصنع أشياء مقبولة باستخدام الذكاء الاصطناعي العام بشرط أن يكونوا ماهرين بما يكفي لمعرفة كيفية التغلب على قيود التكنولوجيا. على الرغم من أن لقطات الفيلم قصيرة جدًا، مثل معظم مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي، إلا أنه تم تحريرها معًا بطريقة تخلق الوهم بأنها جزء من لقطات أطول. وعلى الرغم من أن الأحرف الموجودة في المسافة يتم قصها أحيانًا داخل وخارج الأنظار، يمكنك أن ترى أن Seedance 2.0 يحاول التعتيم على تلك الأخطاء من خلال تغطيتها بأشياء تتحرك في المقدمة.
يمكن لصانعي الأفلام أن يصنعوا أشياء مقبولة باستخدام الذكاء الاصطناعي العام إذا كانوا يعرفون كيفية التغلب على قيود التكنولوجيا
إذا كان أي شيء، رقصة جيا تشانغكي يوضح لنا مدى عدم بذل العديد من المتحمسين للذكاء الاصطناعي قصارى جهدهم لجعل إبداعاتهم تبدو وكأنها نوع من الفن الذي من شأنه أن يضع أعقابهم في المسارح أو يدفع الناس إلى الاشتراك في خدمة البث المباشر. يستحق مهندسو ByteDance بعض الفضل على الأقل في بناء نموذج يمكنه إعادة إنشاء وجوه الأشخاص الحقيقيين بهذه الدقة. ولكن يبدو إلى حد كبير كما لو أن هذه القوة قد تكون مرتبطة ببيانات التدريب غير المشروعة للنموذج، والتي وضعت ByteDance في مأزق كبير لدرجة أن الشركة أوقفت مؤقتًا خططها لإصدار واجهة برمجة تطبيقات Seedance 2.0 للجمهور.
بالإضافة إلى مظهره الأفضل مما هو عليه حاليًا، فإن الطريقة الوحيدة التي قد يتمكن بها الفيديو الناتج عن الذكاء الاصطناعي من التخلص من الارتباط مع الانحدار هي أن تثبت الشركات التي تقف وراءه أن نماذجها يمكنها إنشاء أشياء دون الحاجة إلى سرقة أعمال الآخرين. استوديوهات مثل Asteria و الشركات بما في ذلك أدوبي يحاولون معالجة هذه المشكلة الثانية من خلال نماذج “آمنة IP” مبنية على بيانات تم ترخيصها بشكل صحيح. ولكن حتى نبدأ في رؤية عمل جيد يخرج من هذه الموجة الجديدة من برامج الذكاء الاصطناعي، فسوف يكون الأمر بطيئًا على طول الطريق.


