في السنوات الأخيرة، شهدنا الذكاء الاصطناعي التوليدي يتحرك بسرعة عبر عصور مختلفة: روبوتات الدردشة، وتوليد الصور، وتوليد الصوت، وتوليد الفيديو، والمزيد. لكن الدكتورة فاي فاي لي، رائدة الذكاء الاصطناعي منذ فترة طويلة والمديرة المشاركة لمعهد ستانفورد للذكاء الاصطناعي المرتكز على الإنسان (HAI)، تدرس ما تعتقد أنه الحدود التالية: الذكاء المكاني، وهو مجال ناشئ تعتقد أنه “التحدي الأبرز للعقد المقبل”، كما كتبت في Substack. بريد هذا الاسبوع.
ولهذا السبب شارك لي في تأسيس World Labs في عام 2024 – وجمع 230 مليون دولار في الخريف الماضي – لبناء نماذج عالمية، أو نماذج ذكاء اصطناعي توليدية يمكنها “إدراك العالم ثلاثي الأبعاد وتوليده والتفكير فيه والتفاعل معه”، وفقًا للشركة. وهذا الأسبوع، أطلقت World Labs منتجها التجاري الأول، رخام، والذي يسمح للمستخدمين بإنشاء عوالم ثلاثية الأبعاد خاصة بهم قابلة للتنزيل من خلال مطالبات نصية أو صورية أو فيديو. كتبت لي أنها تتوقع أن الذكاء المكاني من المحتمل أن يغير القطاعات من رواية القصص وصناعة الأفلام إلى الهندسة المعمارية والروبوتات والاكتشاف العلمي.
وقال لي، وهو أيضًا الرئيس التنفيذي للشركة: “نرى أن النموذج العالمي كبير ومثير، إن لم يكن أكثر (من العصور السابقة)”. الحافة في مقابلة.
وقال بن ميلدنهال، المؤسس المشارك لـ World Labs: “إن جلب الحياة ثلاثية الأبعاد، وفهم ثراء الأشياء المكانية وثلاثية الأبعاد، هو مجرد مستوى تالٍ كامل يتجاوز خط الأساس لمعظم هذه الأوضاع الفردية الأخرى”. الحافة. وأضاف أنه بالنسبة للفرق البشرية فقط، “إن بناء هذه العوالم يمثل مشكلة كبيرة. فهو يتطلب فريقًا كبيرًا والعديد من البرامج والكثير من الوقت والجهد… فكر في التغيير الجذري هناك، الذي يمكن أن يحدث إذا قمت بتمكين الأشخاص من بناء الأشياء بسرعة أكبر بكثير – التفكير في الأشياء، وتكرارها، وتحريرها في حلقة أكثر إحكامًا”.
تقدم شركة Marble أربعة مستويات للاشتراك: مجاني، والذي يسمح بما يصل إلى أربعة أجيال عالمية؛ قياسي (20 دولارًا شهريًا)، والذي يسمح بما يصل إلى 12 جيلًا والمزيد من خيارات التحرير؛ Pro (35 دولارًا شهريًا)، والذي يسمح بـ 25 جيلًا وحقوقًا تجارية؛ وMax (95 دولارًا شهريًا)، والذي يسمح بما يصل إلى 75 جيلًا، بالإضافة إلى كل ما تقدمه الطبقة الاحترافية. الحافة كان قادرًا على إنشاء قلعة في الهواء الطلق بها شلالات، وفي أجيال المستخدمين الآخرين، استكشاف الهياكل المدمرة التي استصلحتها الطبيعة والمنازل الكروية التي تشبه الهوبيت. كان من الممكن اتخاذ بضع خطوات في مثل هذه البيئات قبل الاصطدام بشكل أساسي بجدار في الجيل ثلاثي الأبعاد، وفي المستويات غير المجانية، تتوافق الملفات التي تم تنزيلها مع أدوات مثل Unreal Engine وUnity. قال ميلدنهال إنه رأى بعض الأشخاص المستعدين للعمل لساعات طويلة قادرين على تصميم “بيئات كبيرة إلى حد ما” باستخدام الرخام.
وقال ميلدنهال إنه يستطيع أن يتخيل أن المؤلفين يستخدمونه لبناء عالمهم المتخيل، أو الأشخاص الذين يعملون على المؤثرات البصرية أو مستكشفي المواقع في صناعة الأفلام. وعلى مستوى المؤسسة، قال إنه يمكنه أن يتخيل الشركات التي تستخدم شركة ماربل أو أحد منتجات World Labs المستقبلية لتحليل وتصور مجموعات واسعة من البيانات الخاصة بها.
وقال لي: “حتى في ظل القيود المفروضة على هذا النموذج، فإننا نرى الضوء خارج ما نحن فيه في بعض السلوكيات الناشئة”، مضيفًا أن الناس يمكنهم تجميع المساحات بطريقة “تتجاوز الخيال البشري”.


