يعد نموذج الذكاء الاصطناعي الجديد من أي شيء إلى أي شيء من Google أمرًا جامحًا

العام الماضي أنا تم تزييف دمية طفلي المحشوة بعمق ليجعل الأمر يبدو وكأن غزالته الفاخرة كانت في إجازة.

لقد كانت تجربة لمعرفة ما إذا كان بإمكاني إعادة إنشاء الأحداث التي تم تصويرها في إعلان الجوزاء الذي كان Google يعرضه، ولم أعرض مطلقًا مقاطع الفيديو الخاصة بالغزال Buddy حول مغامراته لطفلي البالغ من العمر أربع سنوات. لكنه كان تمرينًا كاشفًا جعلني أفكر كثيرًا في الفرق بين بعض المرح غير المؤذي مع الذكاء الاصطناعي التوليدي والانحدار الكامل. ربما يكون مخطط فين هذا عبارة عن دائرة مثالية! ربما لا. ولكن ما أعرفه على وجه اليقين هو أن الأدوات اللازمة لإنشاء مقاطع فيديو واقعية جيدة بشكل مدهش، وتتطلب القليل من الجهد والمعرفة. ويستمر هذا الاتجاه في عصر أومني في الجوزاء.

أومني هي عائلة جديدة من النماذج التوليدية يُزعم أنه في يوم من الأيام سيكون قادرًا على تحويل أي نوع من المدخلات – الصور والفيديو والنصوص – إلى أي شيء آخر. ولكن بالنسبة للمبتدئين، فهو مجرد إنشاء فيديو. Omni Flash هو أول هذه النماذج التي أصدرتها Google، وهي متاحة الآن في منصة إنشاء وتحرير الفيديو AI الخاصة بالشركة، Flow. لا يزال بإمكانك استخدام النموذج السابق، Veo، إذا كنت ترغب في ذلك، ولكن Omni يعمل على تحسين Veo بعدة طرق.

باستخدام Omni، يمكنك تحميل مقطع فيديو واستخدامه جنبًا إلى جنب مع رسالة نصية كنقطة بداية للإبداع الذي يتم إنشاؤه بواسطة الذكاء الاصطناعي. تدعي Google أيضًا أن Omni يدمج المزيد من المعرفة الواقعية عند إنتاج مقاطع الفيديو ويمكنه القيام بعمل أفضل في الحفاظ على تناسق الشخصيات طوال الفيديو نتيجة لذلك. كانت هناك طريقة واحدة فقط لمعرفة ما إذا كانت هذه الادعاءات صحيحة حقًا: لقد أحضرت AI Buddy ليحزم حقائبه الصغيرة التي تم إنشاؤها بواسطة الذكاء الاصطناعي لمغامرة أخرى.

وكانت النتائج عبارة عن حقيبة مختلطة لدرجة أنها محيرة. كان بعضها جيدًا جدًا، وكان أكثر اتساقًا وصدقًا مع مطالبتي مما كان عليه عندما كنت أختبر Veo قبل خمسة أشهر. ولكن حتى أفضل المقاطع التي أعدها Omni لي لا تزال تحتوي على بعض المخاوف من قفز الذكاء الاصطناعي، مثل عندما يقوم Buddy بتغيير اتجاهه فجأة أثناء القفز بالمظلة.

في فيديو آخر، أعطيت أومني بعض الحرية الفنية. “قم بإنشاء مونتاج لـ Buddy وهو يحزم أمتعته لقضاء إجازة وينطلق على متن سفينة سياحية لقضاء إجازة استوائية. المزاج لطيف ومرح. يحزم Buddy شيئًا مضحكًا في حقيبته والذي يتم تشغيله لاحقًا في المقطع.” كان بها بادي يحزم جرة من العسل؛ في وقت لاحق من المقطع، يصل إليها كما لو كانت زجاجة من واقي الشمس. “آه،” تقول الشخصية وهو يرش العسل على حافره.

بصراحة، ليس سيئا بعض الشيء. إلا أن زجاجة العسل تتغير باستمرار طوال الفيديو، من جرة إلى زجاجة بخاخة شفافة مملوءة بالماء، ثم تعود إلى زجاجة ضغط مليئة بالعسل. ولا أستطيع حتى أن أبدأ في وصف كيف توصل النموذج إلى الإطار النهائي للفيديو – تقريبًا كما لو أنه جمع مجموعة من عناصر التسلسل الذي صنعه للتو.

يمكنك استخدام المطالبات النصية لاقتراح تعديلات على مقاطع الفيديو الخاصة بك، وسأمنح Google رصيدًا: يعمل هذا بشكل أفضل مع Omni عما كان عليه عندما اختبرت Veo 3. لكن النتائج كانت سيء مع Veo – سيء جدًا لدرجة أنني وجدت أنه من الأسهل أن أعرض مقطع فيديو جديدًا من الصفر في كل مرة أرغب في تغيير شيء ما. سيأخذ Omni تعديلاتك في الاعتبار، لكن النتائج لا تظهر دائمًا.

لقد جعلتها تؤكد على ردود أفعال وجه بادي في مقاطع إجازته، وانتهى الأمر بالنتائج تبدو غريبة. كما أنه سيمنح Buddy قرونًا من وقت لآخر، وهو ما لا يملكه. الصديق هو طفل، شكراً جزيلاً. وعندما طلبت منه إزالة القرون التي ظهرت في أحد المشاهد، التزم بذلك، ثم أضاف القرون في جميع المشاهد الأخرى.

الشيء هو أن لا شيء من هذا مجاني. يتكلف إنشاء مقاطع فيديو أرصدة تتراوح من 15 إلى 40 نقطة بناءً على طول المشهد و”المكونات” التي تبدأ بها. جولة واحدة من التعديلات تكلف 40 ساعة معتمدة. لدي خطة AI Pro بقيمة 20 دولارًا شهريًا والتي تأتي مع 1000 نقطة كل شهر. بعد حوالي 20 مقطعًا تم إنشاؤها مع بعض التعديلات على بعضها، وصلت إلى 145 مقطعًا. إذا كانت لديك أفكار محددة حول الفيديو الذي تريد من Omni إنشاءه، فقد تنظر إلى الكثير من التغييرات المكلفة مع النموذج للحصول على فيديو قريب من رؤيتك.

أستطيع أن أقول بصدق أنني لم أكن مستعدًا لما رأيته

إحدى نقاط القوة المزعومة لدى Omni هي إضافة أشياء تم إنشاؤها بواسطة الذكاء الاصطناعي إلى مقاطع الفيديو الحقيقية، لذلك أعطيت Buddy فترة راحة وقمت بالتزييف العميق بنفسي. بدءًا من فيديو سيلفي مع تعبير محايد، دفعت Omni إلى إنشاء مقاطع فيديو لي وأنا أتناول طبقًا من السباغيتي، وأجلس في مقعد الطائرة، وأقف أمام برج إيفل وأتناول قضمة من الخبز الفرنسي. ويمكنني أن أقول بصدق أنني لم أكن مستعدًا لما رأيته.

هناك قصص الذكاء الاصطناعي في مقاطع الفيديو المزيفة الخاصة بي. إن صوت الشوكة الذي يضرب وعاء المعكرونة مُصنع قليلاً. هناك امرأة في خلفية فيديو الطائرة تظهر مرتين. لكن بصرف النظر عن تلك الأخطاء الصغيرة والشعور الغامض الغامض بها، فهي مقنعة للغاية.

عرضت على زوجي مقطع المعكرونة؛ كان يعلم أنني كنت أختبر أداة فيديو تعمل بالذكاء الاصطناعي، لكنني لم أخبره بما تم إنشاؤه بواسطة الذكاء الاصطناعي في المشهد. وبدون معرفة ما الذي تم إنشاؤه بواسطة الذكاء الاصطناعي حول هذا الموضوع، فقد صدق أنني كنت جالسًا أمام الكاميرا أتناول المعكرونة، وقال إن دليله الوحيد على وجود شيء ما هو أن الوعاء يبدو غير مألوف. بدا تناول المعكرونة في حد ذاته حقيقيًا بما يكفي لإقناعه زوجي. الرجل الذي نظر إلي في الحياة الحقيقية بشكل أساسي كل يوم على مدى العقد الماضي.

تتميز عمليات التزييف العميق الأخرى بمستويات متفاوتة من “الجيدة بما يكفي لخداع الأشخاص على وسائل التواصل الاجتماعي”. يبدو بعض مقاطع برج إيفل كرتونية بعض الشيء، لكن أحدهما مقنع بدرجة كافية لدرجة أنك قد تحتاج إلى إعادة مشاهدته عدة مرات لتتأكد من أنه ذكاء اصطناعي. أنا أعرف أنني لست أنا عندما أدارت الذكاء الاصطناعي رأسها وكشفت عن شعرها المسحوب للخلف على شكل ذيل حصان. لكنني لست متأكدًا من أن أي شخص آخر سيعرف الفرق، وهذا يجعلني أشعر بالغرابة.

نحن بالتأكيد في عمق الوادي الغريب

أنا مرهقة قليلاً من كل هذا، لأكون صادقًا. لقد صدمت عندما اختبرت Veo 3 بالواقعية التي يمكن أن تنتجها. لقد صدمت من مدى سهولة تصوير أشخاص مزيفين في صور مزيفة مرارًا وتكرارًا خلال السنوات القليلة الماضية. من المحتمل أن أشعر بالصدمة من أومني أيضًا، وأعتقد أنني كذلك، لكن الحافة قد تلاشت.

لا يزال ليس من السهل تمامًا إنشاء تحفة سينمائية من إنتاج الذكاء الاصطناعي كما تريد جوجل أن تصدق. لكن Omni يقوم بتحسين Veo ببعض الطرق المعروفة. إذا كان لديك حساب Google وبطاقة ائتمان، فيمكنك التقاط مقطع فيديو لنفسك وأنت جالس في المنزل وتجعله يبدو وكأنك في رحلة إلى جزيرة ماوي بجهد بسيط. لا أعتقد أننا في “سفوح التفرد“بالضبط، لكننا بالتأكيد في عمق الوادي الغريب.

تم إنشاء جميع الصور ومقاطع الفيديو في هذه القصة بواسطة Google Gemini.

متابعة المواضيع والمؤلفين من هذه القصة لرؤية المزيد من هذا القبيل في خلاصة صفحتك الرئيسية المخصصة وتلقي تحديثات البريد الإلكتروني.

أليسون جونسون

المصدر

يحصل Alexa Plus على تحديث للذكاء الاصطناعي للتعامل مع التعليمات الأكثر تعقيدًا

الوضع الصوتي لـ Claude متاح الآن لـ Opus وSonnet

يقوم Patreon بتسريح 20 بالمائة من العمال

ذات صلة

يحصل Alexa Plus على تحديث للذكاء الاصطناعي للتعامل مع التعليمات الأكثر تعقيدًا

الوضع الصوتي لـ Claude متاح الآن لـ Opus وSonnet

يقوم Patreon بتسريح 20 بالمائة من العمال

جمع

يحصل Alexa Plus على تحديث للذكاء الاصطناعي للتعامل مع التعليمات الأكثر تعقيدًا

الوضع الصوتي لـ Claude متاح الآن لـ Opus وSonnet

يقوم Patreon بتسريح 20 بالمائة من العمال

تقدم OpenAI ادعاءات كبيرة أثناء طرح ChatGPT Health للجميع

يقوم المشرعون بإعداد مشروع قانون يتطلب “مفتاح القتل” للذكاء الاصطناعي

يعد نموذج الذكاء الاصطناعي الجديد من أي شيء إلى أي شيء من Google أمرًا جامحًا

شركة

الأكثر شهرة

يحصل Alexa Plus على تحديث للذكاء الاصطناعي للتعامل مع التعليمات الأكثر تعقيدًا

الوضع الصوتي لـ Claude متاح الآن لـ Opus وSonnet

يقوم Patreon بتسريح 20 بالمائة من العمال

أحدث المقالات

يحصل Alexa Plus على تحديث للذكاء الاصطناعي للتعامل مع التعليمات الأكثر تعقيدًا

الوضع الصوتي لـ Claude متاح الآن لـ Opus وSonnet

يقوم Patreon بتسريح 20 بالمائة من العمال