أعطيت جوجل نانو الموز برو الجديد محاولة، وعلى الفور خلعت ملابسي. لم أطلب ذلك، ولكن من الواضح أن نموذج الذكاء الاصطناعي قرر أن بطاقة التهنئة الخاصة بي ستبدو أفضل مع المزيد من الجلد.
Nano Banana Pro، كما يوحي الاسم، يستهدف المحترفين. مدعوم من الجوزاء 3، إنها في الواقع ترقية لأداة إنشاء الصور وتحريرها الشهيرة للشركة والتي انتشرت بسرعة كبيرة في اتجاه وسائل التواصل الاجتماعي تحويل صور السيلفي إلى تماثيل ثلاثية الأبعاد واقعية للغاية. تقول Google إنها تتيح لك إنشاء صور ذات جودة أعلى يمكنك طباعتها، وتقديم نص واضح على الصور، ومزج صور متعددة معًا في تركيبة واحدة. وقالت ناينا رايسينجاني، مديرة المنتج في Google DeepMind، إن هذا التطبيق مخصص أيضًا “للأشخاص الذين يريدون أن يشعروا بأنهم محترفون”. الحافة. يبدو ذلك جيدًا، لأنني لست محترفًا بأي حال من الأحوال. بالنسبة لي، كانت النتائج لامعة، ولكن أبله. لقد بدت جيدة، لكنها شعرت بأنها هواة.
يعد استخدام Nano Banana Pro أمرًا بسيطًا جدًا: تذهب إلى تطبيق Gemini، وتحدد “إنشاء صور”، ثم تقوم بالتبديل إلى وضع “التفكير”. ما عليك سوى توصيل المطالبة (والصورة، إذا كنت تستخدم واحدة) والبدء. كما أنه مجاني أيضًا، على الرغم من وجود حدود، مع توسيع الحصص لمشتركي Google AI Plus وPro وUltra.
تقدم Google بعض الادعاءات الجريئة، واعدة بـ “تصميمات بجودة الاستوديو”، و”عرض نص لا تشوبه شائبة”، ومجموعة من التعديلات الأنيقة والإبداعية. لاختبار ذلك، قمت بتحميل صورة بسيطة لنفسي بالقرب مني الحافة مكتب في نيويورك مع جسر بروكلين في الخلفية. لقد طلبت من جيميني تغيير الإضاءة من النهار إلى الليل وقد قامت بعمل جيد جدًا. تبدو النتيجة قابلة للتصديق. حتى أنها تعاملت مع التفاصيل التي غالبًا ما تعوق مولدات الصور، مثل جعل السيارات تسير في الاتجاه الصحيح. كان ضبط زاوية الكاميرا سهلاً بنفس القدر. لقد طلبت من جيميني إعادة إنشاء اللقطة كما لو أنها مأخوذة من زاوية أعلى على اليمين، وقد فعلت ذلك.

الصورة: The Verge والصورة: The Verge / Google، Nano Banana Pro
وتقول Google أيضًا إن Nano Banana Pro يمكنه إنشاء رسوم بيانية ورسوم بيانية للمساعدة في تصور المعلومات في الوقت الفعلي مثل الطقس أو الرياضة. كوني بريطانية، سألت عن الطقس للأيام الأربعة المقبلة في واشنطن العاصمة، ومدينة نيويورك، حيث أتواجد حاليًا. من الناحية المرئية، كان مخطط المعلومات البياني موجودًا في المنزل على موقع تنبؤات أساسي. بدا النص والأرقام طبيعية – بعيدة كل البعد عن الهراء المشوه الذي غالبًا ما تراه في الصور التي ينشئها الذكاء الاصطناعي – وأعطاني جيميني قائمة من الاستشهادات في النهاية التي ساعدتني على التأكد من دقتها.
تعثر النموذج قليلاً في المهام الأكثر تعقيدًا. طلبت منه تلخيص الأخيرة حافة قصة عن كيف تعمل أوروبا على تقليص قوانين الذكاء الاصطناعي والخصوصية في شكل كتاب هزلي. لقد تم بالفعل عرض الصور والنصوص بخط كرتوني لا تشوبه شائبة، لكن القصة المصورة لم تلخص القصة على الإطلاق، مما أعطى نظرة عامة غامضة عن القصة. قانون الذكاء الاصطناعي الخاص بالكتلة بدلاً من. ربما كانت المشكلة لأنني أعطيت جيميني رابطًا للقصة، بدلاً من لصق النص فيها.
لقد أعطاني ملخصًا مقبولًا بأسلوب كوميدي عندما فعلت ذلك. لقد نقلت جوهر القصة الفعلية، على الرغم من أنني لا أعتقد أنني كنت سأتمكن من الفهم بسهولة لو لم أكتب المادة المصدر. كما أنها تتكون من عبارات لم تظهر في أي مكان في مقالتي.
لكي أشعر حقًا بأنني مصمم محترف، جربت يدي في صنع بطاقات التهنئة. عيد الميلاد قادم، بعد كل شيء. مع الأخذ في الاعتبار أنني قمت بتحميل ثلاث صور شخصية فقط، فقد قام Gemini بعمل رائع بصراحة حيث أنشأ ثلاث نسخ لكامل الجسم لنفسي، كل منها في ملابس مختلفة وتعابير وجه مختلفة. لقد خلقت أيضًا بيئة ثلجية واقعية مع أشجار عيد الميلاد، كما طلبت منها، وألصقت عليها عبارة “عيد ميلاد سعيد!” في الأعلى كما طلبت ذلك.
أخذت شركة Gemini الحرية عندما طلبت منها تغيير الخلفية الثلجية للبطاقة إلى شاطئ صيفي لقضاء عطلة على الطراز الأسترالي. كانت تلك الحريات هي ملابسي المزيفة: اثنتان من مستنسخاتي كانتا عاريتين. كان غريبا. وكان هناك أيضا بعض البارزين أقدام تم إنشاؤها بواسطة الذكاء الاصطناعي ورجل رمل مبتسم ليحل محل الرجل الثلجي من المشهد الشتوي (الذي تم بناؤه بواسطة شبيهي عاريات الصدر). ومع ذلك، كانت هناك مشكلات – فقد كان رجل الرمل يفتقد الظل، على عكس الكائنات الأخرى المعروضة في الصورة، وكانت أضواء عيد الميلاد في أشجار النخيل متوهجة بطريقة سحرية في الشمس الساطعة. لقد اختبرت مهارات التحرير الدقيقة الخاصة به من خلال مطالبته بإضافة بعض القوة إلى نسخة واحدة فقط، وهو ما فعله في ثوانٍ (لو كان الأمر بهذه السهولة في العالم الحقيقي). بشكل عام، كانت الجودة رائعة، وكانت الصورة قابلة للتصديق إلى حد ما (باستثناء عضلات البطن) إذا لم تكن تعلم أن هناك وشمًا كبيرًا مفقودًا على صدري.
لم يكن كل شيء رائعًا، رغم ذلك. فشل النموذج في الحفاظ على النص الدقيق الموجود على بطاقتي والذي طلبته منه. بدلاً من “عيد ميلاد سعيد!” لقد اختارت “عيد الميلاد الصيفي الأسترالي!” يبدو أيضًا أنها تعاني من صراع مع الحيوانات: قطة أختي تجلس في نفس الوضعية تمامًا مثل الصورة المرجعية التي قدمتها في كل نسخة من البطاقة (على الرغم من ذلك، فقد تم إعطاؤها قبعة سانتا غريبة الأطوار).
وبشكل عام، لقد تأثرت. يعد Nano Banana Pro ترقية واضحة للنموذج الأساسي. لقد تمكنت من طلب تعديلات أكثر دقة، وهو ما ينتج بالفعل نصًا واضحًا، مما يزيل حاجزًا ضخمًا يمنع أدوات الذكاء الاصطناعي التوليدية مثل هذه من أن تكون قابلة للاستخدام في العالم الحقيقي. لكن، للأسف، لم تكن هذه الميزات كافية لتجعلني مصممًا جيدًا.





