الجمعة, ديسمبر 5, 2025
13.2 C
Los Angeles
spot_img

ذات صلة

جمع

لدى Microsoft أخيرًا مربع حوار Run ذو مظهر أفضل لنظام التشغيل Windows 11

تقوم Microsoft أخيرًا بتحديث تصميم مربع الحوار "تشغيل" في...

تعلن شركة Apple عن المزيد من معدل دوران المديرين التنفيذيين

وتقول شركة أبل إن جاكسون، الذي يشغل منصب "نائب...

تقرير البنتاغون Signalgate وجد أن بيت هيجسيث انتهك السياسات العسكرية

لقد مرت أشهر منذ أن قامت مجموعة من مسؤولي...

يتسبب التسعير الديناميكي لشركة أمازون في إحداث فوضى في ميزانيات المدارس

تدفع المناطق التعليمية مبالغ إضافية مقابل الإمدادات الأساسية بفضل...

يقول التقرير إن إدارة ترامب قد ترفض تأشيرات H-1B للأشخاص الذين عملوا في الإشراف على المحتوى

أمرت إدارة ترامب القنصليات الأمريكية بالنظر في رفض المتقدمين...

مولد موسيقى الذكاء الاصطناعي الذي تمت ترقيته من Suno هو مثير للإعجاب تقنيًا ، لكنه لا يزال بلا روح


عندما لا تحاول ذلك صد الدعاوى القضائية من علامات التسجيلات الرئيسية ، لا تزال Suno تعمل على تحسين أداة إنشاء موسيقى AI. أحدث طراز ، Suno V5 ، هو تحسن فني واضح على نسخته السابقة ، v4.5+. لكن لا يزال يبدو أنه لا يمكن أن يفلت من الفراغ اللطيف الذي ينتشر في معظم فن الذكاء الاصطناعي.

هناك بعض الترقيات الشاملة في جودة الصوت التي لا يمكن إنكارها ، مثل عدد أقل من القطع الأثرية والفصل الأكثر وضوحًا بين الأدوات. بعض المسارات التي تم إنتاجها باستخدام V4.5+ يمكن أن تسيء إلى جميع الأجزاء اللحن معًا بطريقة تكون فيها الخطوط بين الجيتار والباس والمواد الموحلة في أحسن الأحوال. ولكن مع V5 ، فإن الخلطات أكثر نظافة.

خلال العرض التوضيحي ، أشار هنري فيبس ، مدير منتجات Suno ، إلى أغنية كان لدينا النموذج الذي شمل موالفة تشبه الفلوت مع ما بدا وكأنه تأثير تأخير بينج بونج: “لم أسمع من قبل في النماذج السابقة … ما يقول لي هو أن النموذج يدرك أن هذا هو سليم معزول يتم استنساخه ببراعة في جزء مختلف من الحقل المستريمي”. نظرًا لأن Suno لا يطبق التأثيرات في الواقع بالمعنى التقليدي ، فهذا يعني أن النموذج يحدد أداة معينة وتقريب صوت تأخير ستيريو لأنه قرر أن هذا هو ما يجب أن يبدو عليه.

لا توجد حواف لأي من غناء الشمس. كل شيء يستحم في تردد ، وطبقة مع التوافقيات ، وعلى ملعب تماما. حتى لو كنت تخبرها صراحة بعدم القيام بهذه الأشياء ، فإن النموذج يتجاهلك فقط.

يدعي Suno أيضًا أن V5 لديه فهم أفضل للنوع ، على الرغم من أن هذا الادعاء يبدو مشكوكًا فيه من اختباري. مع بعض مطالاتي مثل “Avant R&B الحديثة مع الطبول اللامعة ، ولكن غير تقليدية ، وأجزاء لحنية في الغلاف الجوي ، والغناء الأنفاس” ، لا يبدو أن V5 أو V4.5+ هو الفائز الواضح في تقديم ما كان يدور في ذهني (معظمهم من كيليلا تفكني). كلاهما اقتربوا ، مما أعطاني مسارات owntempo مع بعض موالفة مزاجية ، لكنهما افتقروا إلى الغرابة التي كنت آمل فيها.

لم يتمكن Suno من معرفة ما كنت أبحث عنه تمامًا من خلال “أوائل التسعينيات من القرن الماضي” ، تم تسجيل صخرة مستقلة على مسجل كاسيت من 4 مسارات مع غناء رئيسي خارج والقيثارات اللحن “، ولكن V5 كان بالتأكيد أكثر من الهدف. على الرغم من كل ما جربته ، لم أستطع الحصول على Suno لتصحيح أي شيء بدا حتى الآن مثل الرصيف. البوب ​​الضوضاء المتجانسة التي ارتبط بها مائل وساحر لم يتم العثور عليه في أي مكان. بدلاً من ذلك ، حصلت على صخرة “إيندي” بومباستيكية مع ريففس مكتنزة وحبال القوة القيادة النظيفة. استمر Suno V5 في تقديم الأغاني التي بدت أشبه بالقرود في القطب الشمالي أكثر من أي شيء تم إصداره قبل نهاية القرن.

وبالمثل ، في اختباري ، بدا أن V5 يكافح مع عصر أو مطالبات خاصة بالعقد في بعض الأحيان. عندما طلبت “أواخر سبعينيات القرن العشرين Krautrock” ، v4.5+ يسمارها بشكل أساسي خارج الغناء (المزيد عن ذلك لاحقًا). لكن V5 يقدم غالبًا سينثبوب في الثمانينات من القرن الماضي والمسارات التي تكون أكثر حداثة بشكل واضح ، حتى لو كان لديهم بعض الحمض النووي الكلاسيكي Krautrock.

ما سأقوله هو أن الترتيبات التي يخلقها طراز Suno V5 أكثر تعقيدًا. بالمقارنة مع V4.5+، هناك المزيد من الازدهار الموسيقي لمرة واحدة يمنع الأشياء من الحصول على هياكل أغاني متكررة للغاية وأكثر تنوعًا. عندما يكون V4.5+ عادةً راضيا عن التمسك بهيكل آية أساسية من الأطراف (مع وجود جسر يتم تشغيله بشكل جيد) ، فإن V5 غالبًا ما يكون له أقسام ما قبل أو ما بعد الجوقة ، أو الجسور المتعددة أو الأعطال ، وبناءً عمومًا على مدار مسار يقدم أكثر من أقسام متميزة فقط.

كما أنه حقق نتائج مثيرة في بعض الأحيان عند إعادة تعزيز المسارات الحالية. لقد قمت بتحميل أغنية من EP التي أصدرتها قبل بضع سنوات (والتي ربما كان ينبغي أن تعثر على مرشح حقوق الطبع والنشر) ونظرت ، لن أكذب ، لقد أحببت نوعًا من الطريقة التي قام بها بنسخ الأجزاء من الغيتار المنفرد إلى زخارف موالفة متكررة وأحولت وسادات الوتر الكبيرة إلى قيادة Arpeggios.

ولكن ما كان مفقودًا في كل أغلفة أغنيتي التي طلبت من Suno إنشاءها هو طبيعة المسار الخام ، سجلت في غرفة المعيشة في الساعة 3 صباحًا منذ حوالي ست سنوات. وهذا نوع من موضوع الجري هنا. في حين أن Suno يمكن أن يحاكي بعض الميزات السطحية للتسجيل القديم أو الأداء البشري مثل همسة الشريط أو الأنفاس ، إلا أنها تشعر دائمًا بأنها غير صحيحة.

يعترف Phipps بأنه لم يسمع النموذج الصوتي يعيد إنشاء العيوب الفريدة للأداء البشري الحقيقي. في رسائلها المبكرة حول V5 ، وصفت Suno “غناءها الغني عاطفياً” و “العمق العاطفي الذي يشبه الإنسان” ، لكن هذه الصياغة تغيب الآن عن أي مواد مواجهة عامة. بدلاً من ذلك ، اختارت الشركة الآن وصف الغناء بأنه “طبيعي ، أصيل” ، وهم يتغيرون إلى “اختيار الأسلوب”.

ولكن حتى هذا يبدو وكأنه امتداد. بينما ، نعم ، مقارنةً بـ V4.5+ تشعر الغناء بمزيد من الإنسان ، فهي لا تزال قاسية. أوضح Phipps أنه “عندما نتصور صوتًا من Suno (v4.5) على أنه مسطح عاطفيًا ، أعتقد أن السبب في ذلك هو أنه يفتقد فقط بعض التفاصيل التي تمنحها هذه الحافة” ، وأن الإخلاص العالي لنموذج V5 يوفر هذا التفاصيل.

من الصعب الجدال مع الجوانب الفنية لهذا الادعاء – العروض الصوتية أكثر تفصيلًا – لكنها لا تزال عامة مؤلمة. ينتهي كل صوت صخري يبدو وكأنه تخيل دراغونز أو مومفورد وأولاده ، وكل أغنية R&B مثل أديل المشي في النوم أو أريانا غراندي.

لا توجد حواف لأي من غناء الشمس. كل شيء يستحم في تردد ، وطبقة مع التوافقيات ، وعلى ملعب تماما. حتى لو كنت تخبرها صراحة بعدم القيام بهذه الأشياء ، فإن النموذج يتجاهلك فقط. لقد طلبت من V5 عن “منفرد عاطفي غير مجبر” أداءً صوتيًا للإناث الكاببيلا بدون تردد ، ولا تناسق ، ولا آثار ، فقط غناء جاف. ” تم استحمام الأغاني اللتين تم تسليمهما في تردد ، وشملت المطربين الإضافيين المتناسقين مع الأول ، وحتى واحدة كانت لديها ما بدا وكأنه مرافقة الجهير. (رغم ذلك ، ربما كان صوتًا يقارب صوتًا.) لكن Phipps لم يفاجأ. “لا تفهم النماذج أوصاف التأثيرات المحددة وتقنيات التسجيل. الطريقة التي يتم بها تنفيذ الصوتية تتأثر أكثر بالأغاني والمزاج العام”.

لذلك ، أطعمت كلمات صن فقط مختلف بما فيه الكفاية عن الحجر المتداول “مأوى Gimme لتجنب الحصول على العلم لانتهاك حقوق الطبع والنشر. في البداية ، بدا أن لديها جميع العناصر التي تجعل الأصلي مدمرة للغاية. منضدة أنثى قوية تصرخ على ترتيب كامل ، ولكن كان له كل التأثير العاطفي لكتاب طب الأسنان.

عندما أستمع إلى “ملجأ Gimme ، هذه هي الطريقة تشققات الصوت عندما تحبط “الاغتصاب والقتل” أثناء الجسر الذي يجعلني أخنق. إنها حربية روبرت سميث خارج النغمة هي التي تنقل اليأس في “لماذا لا أستطيع أن أكون أنت“والإرهاق الملموس في أنفاس كورت كوبين مباشرة قبل أن يسلم الخط الأخير في”أين نمت الليلة الماضيةهذا يخبرك أن هذا رجل يكافح مع شياطين حقيقيين.

بشكل عام ، كانت محاولة جعل Suno Sound “سيئًا” – خارج النغمة ، مفتاح خام ، خارج ، قذرة – غير مجدية. على الرغم من كل حديث الشركة عن كيفية ظهور غناء النموذج الجديد ، فإنه يفتقر إلى العيوب التي غالباً ما تحمل الوزن العاطفي للأداء. ما زال المطربون الافتراضيون في صن يبدو منفصلين. قد يفهم النموذج V5 أن غنائيًا معينًا يجب أن يكون حزينًا ، لكن ليس له علاقة عاطفية فعلية بالكلمات ، لأنه كومة من الكود ، وليس فنانًا.

اتبع الموضوعات والمؤلفين من هذه القصة لرؤية المزيد مثل هذه في موجزك الرئيسي للصفحة الرئيسية وتلقي تحديثات البريد الإلكتروني.




المصدر

المقالة القادمة
spot_imgspot_img