يستمر سباق شركات التكنولوجيا الكبرى للقفز على أحدث نماذج الذكاء الاصطناعي مع إطلاق الجيل التالي من مولد الفيديو من ByteDance. في مشاركة مدونةتقول ByteDance – الشركة الصينية التي تقف وراء TikTok سيدانس 2.0 يدعم المطالبات التي تجمع بين النص والصور والفيديو والصوت.
تدعي الشركة أنها “تحقق قفزة كبيرة في جودة التوليد”، حيث تقدم تحسينات في إنشاء مشاهد معقدة ذات مواضيع متعددة وقدرتها على اتباع التعليمات. يمكن للمستخدمين تحسين مطالباتهم النصية عن طريق تغذية Seedance 2.0 بما يصل إلى تسع صور وثلاثة مقاطع فيديو وثلاثة مقاطع صوتية.
يمكن للنموذج إنشاء مقاطع صوتية تصل مدتها إلى 15 ثانية، مع أخذ حركة الكاميرا والمؤثرات البصرية والحركة في الاعتبار. ويمكنه أيضًا الرجوع إلى القصص المصورة المبنية على النصوص، وفقًا لـ ByteDance.
في أحد الأمثلة التي شاركتها ByteDance، والتي تُظهر اثنين من المتزلجين على الجليد يؤديان روتينًا معًا، تقول الشركة إن Seedance 2.0 يمكنه “أداء سلسلة من الحركات عالية الصعوبة بشكل موثوق – بما في ذلك الإقلاع المتزامن، والدوران في الهواء، والهبوط الدقيق على الجليد – مع اتباع القوانين الفيزيائية في العالم الحقيقي بشكل صارم”.
وقد بدأ المستخدمون على وسائل التواصل الاجتماعي بالفعل في عرض ما يمكن أن تفعله الأداة الجديدة، حيث قام أحد الأشخاص بنشر مقطع فيديو تم إنشاؤه بواسطة الذكاء الاصطناعي مع الأمثال براد بيت وتوم كروز في مشهد قتال سينمائي. تجمع القتلى الكاتب ريت ريس أعاد نشر الفيديو مع التعليق: “أنا أكره أن أقول ذلك. من المحتمل أن يكون الأمر قد انتهى بالنسبة لنا”.
في الوقت الحالي، يتوفر Seedance 2.0 فقط من خلال منصة ByteDance’s Dreamina AI ومن خلال مساعد الذكاء الاصطناعي Doubao. من غير الواضح ما إذا كانت ستشق طريقها إلى TikTok، خاصة الآن بعد أن أصبح التطبيق تحت ملكية جديدة في الولايات المتحدة.


