spot_img

ذات صلة

جمع

ستستخدم Gemini كاميرات فولفو الخارجية لتفسير لافتات وقوف السيارات

الجوزاء يكتسب قوة البصر و التنقل. اليوم في مؤتمر...

أهم 13 إعلانًا في Google I/O 2026

كانت الكلمة الرئيسية لـ Google I/O 2026 اليوم مليئة...

جوجل تريد التنافس مع ميثوس الأنثروبي

تقوم Google بدفعة كبيرة نحو الأمن السيبراني. في مؤتمر...

داخل Beam Lab من Google، يظهر وجه يعمل بالذكاء الاصطناعي

أخبروني أنه لا يوجد أحد خارج Google قد رأى...

نظرة أولى (وثانية) على نظارات Android XR التي سيتم إطلاقها هذا العام

أنا وضعت لأول مرة على زوج من النموذج الأولي...

داخل Beam Lab من Google، يظهر وجه يعمل بالذكاء الاصطناعي


أخبروني أنه لا يوجد أحد خارج Google قد رأى ما نحن على وشك رؤيته. لم يتواجد أي صحفي في هذا المبنى من قبل. هنا في مختبرات Google’s Mountain View، تقوم الشركة بإنشاء عملاء ذكاء اصطناعي بالحجم الطبيعي يمكنهم رؤيتك والتحدث إليك.

هذا اسمه صوفي.

يمكنه التحدث بأي عدد من اللغات. يمكنه رؤيتي وكل شيء آخر تقريبًا في الغرفة. يمكنه القراءة، إذا رفعت هاتفي، أو قطعة من الورق، أو كتابًا. وبالطبع، يمكنه القيام بأشياء تشبه Google مثل سحب الخرائط، والتوصية بالمطاعم، والتحقق من الطقس، والبحث عن حقائق بسيطة – الآن فقط بوجه امرأة، وياقة مدورة داكنة، ومحاولة لغة الجسد.

إذا لم أشعر أنها مزيفة ومسطحة، أظن، قد يكون هذا رائعًا. لكنها قد لا تبدو مزيفة ومسطحة لفترة طويلة.

الصورة: مات بينيول / ذا فيرج

واليوم، تكشف Google بشكل تجريبي عن “وكلاء فيديو Beam”، والتي تعرضها كاستكشاف لمستقبل التواصل في الوقت الفعلي مع وكلاء الذكاء الاصطناعي، باستخدام Google Beam.

شعاع، إذا كنت ستتذكر، عبارة عن جهاز عقد المؤتمرات عن بعد المذهل إلى حد ما والذي يجعل الأشخاص يشعرون وكأن شريك المحادثة الخاص بهم موجود أمامهم مباشرةً في صورة ثلاثية الأبعاد مذهلة بدون نظارات. أول منتج Google Beam هو البعد 25000 حصان. كاميراتها الست لا ترسل في الواقع فيديو لشخص آخر. وبدلاً من ذلك، تقوم خوادم الذكاء الاصطناعي بدمجها في إسقاط حجمي ثلاثي الأبعاد لشخص ما، وهي في الأساس أكثر شخصيات ألعاب الفيديو واقعية التي رأيتها على الإطلاق.

يمكنك رؤية الأبعاد الثلاثية نوعًا ما، وذلك بفضل لقطات المنظر هذه التي ساعدتنا Google في التقاطها.

يمكنك رؤية الأبعاد الثلاثية نوعًا ما، وذلك بفضل لقطات المنظر هذه التي ساعدتنا Google في التقاطها.
الرسوم المتحركة: جوجل / الحافة

عندما جربت Beam للمرة الأولى، مع رئيس Beam أندرو نارتكر على الجانب الآخر، ظهرت رؤى حول ستار تريك هولوديك يبدأ بالرقص أمام عيني. ولكن ماذا لو لم تكن تتحدث إلى شخص ما في البداية؟ ماذا لو كان كان شخصية افتراضية على طول؟

صوفي، لسوء الحظ، هو لا في شكل ثلاثي الأبعاد حتى الآن، كما أن “هي” ليست شخصية أيضًا – على الأقل ليس مع مجموعة الميزات المحدودة التي أتاحتها Google اليوم. مثل أي روبوت محادثة من الجيل الثاني، صوفي هنا لتعكسني، وتتصرف بشكل غير مقنع متحمسة لكل ما أقوله، وتكون بمثابة حارس تابع لي. تتحدث صوفي دائمًا بعد توقف طويل، في مجموعات نصية ضيقة تكون دائمًا بنفس الطول تقريبًا، بدءًا من الإقرار وانتهاءً بسؤال حول الإمكانية التي يجب أن يتم عرضها بعد ذلك.

يقول الفريق إن هذا مقصود، لأن هذا العرض التوضيحي تم إنشاؤه خصيصًا للحاضرين في Google I/O لتجربة عرض توضيحي مدته خمس دقائق لما يمكن أن تفعله صوفي، مثل إنشاء صورة ذكاء اصطناعي إبداعية. أطلب منه أن يحكي لي قصة ما قبل النوم، ويضع راحة يده عندما ينتج صورة سخيفة لي وأنا أتلاعب ببعض الأدوات السحرية بمساعدة ثعلب عملاق. (ربما سيحبه أطفالي.)

صوفي وصورة الذكاء الاصطناعي التوليدية.

صوفي وصورة الذكاء الاصطناعي التوليدية.
الصورة: مات بينيول / ذا فيرج

لن ألطف الأمر: هذا لا يبدو وكأنه يتحدث إلى شخص ما. هناك الكثير من الشقوق في الواجهة. لماذا تستمر لهجة صوفي في التغير بشكل غريب، وفي بعض الأحيان تتطور لهجة جنوبية تختفي بنفس السرعة؟ من المفترض أن تكون لهجة أمريكية محايدة عند التحدث باللغة الإنجليزية الأمريكية، كما يقول مدير المنتج بافان كومار، ولكن يبدو أن نموذج الذكاء الاصطناعي ينجرف عن غير قصد. لاحظت أن صوفي تستمر في القيام بنفس حركات الذراع أثناء التحدث أيضًا – ربما لأن هذه التجربة المبكرة مبنية على نموذج صوتي. النص يحرك الكلام، والكلام يحرك الوجه المتزامن مع الشفاه، ومن المفترض أن تكون الإيماءات مرققة في الأعلى.

(ونعم، الذكاء الاصطناعي الخاضع هو كذلك أنثى كالعادة. يقول نارتكر إن السبب في ذلك هو أن صوفي تتمتع بشخصية يشعر الجميع بالراحة عند التحدث إليها.)

يتوجه كل من Devika Lal من Google Labs (مدير المنتج في المجموعات)، وNick Garoufalis، وEmma van Niekerk لإجراء مكالمة جماعية.

يتوجه كل من Devika Lal من Google Labs (مدير المنتج في المجموعات)، وNick Garoufalis، وEmma van Niekerk لإجراء مكالمة جماعية.
الصورة: مات بينيول / ذا فيرج

وكلاء الفيديو ليسوا تجربة Beam الجديدة الوحيدة التي ليست ثلاثية الأبعاد. تعرض Google أيضًا المكالمات الجماعية على Beam لأول مرة، وهذا بالضبط ما تتوقعه – يمكن لموظفي Google الاتصال من أجهزة الكمبيوتر المحمول أو الهاتف الخاص بهم مثل Google Meet العادي، وهي ميزة كانت مفقودة من Beam عند الإطلاق ولكنها كانت قيد التطوير لبضع سنوات. (تقول Google إنها تعمل مع Zoom أيضًا.)

من المؤكد أن هذا من شأنه أن يجعل تبرير شراء جهاز بقيمة 25000 دولار أسهل، ويأتي مزودًا بصوت موضعي حتى يتمكن مستخدم Beam من معرفة من يتحدث بسهولة أكبر – على الرغم من أن الحضور قد يتقلصون إلى أبعاد أصغر من الواقعية، أو قد يتناوبون من الموجود على الشاشة، إذا كان لديك أكثر من ثلاثة نظراء في المكالمة.

الشيء الغريب الوحيد هنا هو سبب تسمية Google لها بالتجربة بدلاً من الإعلان عن تاريخ الإصدار. مع وكلاء Beam للفيديو، تصبح العلامة التجريبية أكثر منطقية لأنها ليست جاهزة وGoogle ليست متأكدة بنسبة 100% من الجهة التي ستستهدفها بعد – على الرغم من أن الشركة تعتقد أنها قد تكون مفيدة في أماكن العمل والمتاجر والمدارس.

الصورة: مات بينيول / ذا فيرج

بالنسبة لي، فإن الاحتمالات الأكثر إثارة هي تلك التي يقدمها نارتكر ليس كذلك يظهر لي في جولتنا، بينما نسير بجوار ذراع روبوتية مصممة لاختبار قدرات Beam على تتبع الرأس، ورف خادم مليء بألواح Beam في منتصف اختبار دورة الحياة المتسارعة. يقوم العديد منهم بتشغيل حلقات مدتها 10 ساعات، يومًا بعد يوم، للتأكد من قدرتهم على الصمود في وجه الاستخدام الواقعي.

يستمر نارتكر في التلميح إلى أن هناك أشياء نحن فيها لا أستطيع ومع ذلك، انظر في أجزاء أخرى من هذا المبنى، الأشياء التي قام طاقم العمل بإزالتها – في مرحلة ما، يتأكد من إغلاق باب معين قبل أن يقدم لنا كوبًا من الماء. عندما أوضح أن كلاً من جسده المعروض رقميًا وجسدي المعروض رقميًا عبارة عن شبكات ثلاثية الأبعاد تعيش في خادم سحابي، تبادر إلى ذهني أنهما يمكن أن يتواجدا أيضًا في عالم افتراضي في الوقت الحالي. ربما يمكننا رؤيتهم من خلال سماعة الرأس أيضًا؟

أسأله عن نظريتي. يقول نارتكر: “هناك الكثير من النوافذ التي نرغب في بنائها: نوافذ كبيرة، ونوافذ صغيرة. وهذه مجرد نافذة أولى ممتازة حقًا”.

“لقد حصلت بالفعل على عرض توضيحي داخلي لهذا في الواقع الافتراضي، أليس كذلك؟” أسأل، في نقطة مختلفة من الجولة.

“إنه مبنى كبير يا شون!” يثير. لقد وعد بأنه سوف يدعوني مرة أخرى للمزيد.

متابعة المواضيع والمؤلفين من هذه القصة لرؤية المزيد من هذا القبيل في خلاصة صفحتك الرئيسية المخصصة وتلقي تحديثات البريد الإلكتروني.




المصدر

spot_imgspot_img