الجمعة, ديسمبر 5, 2025
13.2 C
Los Angeles
spot_img

ذات صلة

جمع

تعلن شركة Apple عن المزيد من معدل دوران المديرين التنفيذيين

وتقول شركة أبل إن جاكسون، الذي يشغل منصب "نائب...

تقرير البنتاغون Signalgate وجد أن بيت هيجسيث انتهك السياسات العسكرية

لقد مرت أشهر منذ أن قامت مجموعة من مسؤولي...

يتسبب التسعير الديناميكي لشركة أمازون في إحداث فوضى في ميزانيات المدارس

تدفع المناطق التعليمية مبالغ إضافية مقابل الإمدادات الأساسية بفضل...

يقول التقرير إن إدارة ترامب قد ترفض تأشيرات H-1B للأشخاص الذين عملوا في الإشراف على المحتوى

أمرت إدارة ترامب القنصليات الأمريكية بالنظر في رفض المتقدمين...

أصبح نموذج الذكاء الاصطناعي من Google جيدًا جدًا في انتحال صور الهاتف

بدأت أفهم من أين حصل نموذج الذكاء الاصطناعي المرئي...

أصبح نموذج الذكاء الاصطناعي من Google جيدًا جدًا في انتحال صور الهاتف


بدأت أفهم من أين حصل نموذج الذكاء الاصطناعي المرئي من Google على اسمه، لأنه بعد اللعب به لبضعة أيام، هكذا سألخص الأمر: الموز. الصور التي تولدها واقعية جدًا لدرجة أنها موز. أشعر وكأنني سأذهب إلى الموز بعد التحديق بهم لفترة طويلة. وإذا كان علي أن أحدد سببًا واحدًا يجعل صور Nano Banana Pro تبدو أكثر واقعية من الذكاء الاصطناعي الذي سبقها، فهو هذا: تبدو مثل الصور الملتقطة بكاميرا الهاتف.

بالتأكيد، القصص موجودة إذا بحثت عنها. التقط الصورة الموجودة في أعلى هذه المقالة للزوجين (غير الحقيقيين!) على رصيف المدينة. لا يبدو ضوء الشارع في الخلفية مناسبًا تمامًا بالنسبة لي، وبعض واجهات المباني – خاصة في الخلفية – تبدو غريبة وممتلئة بعض الشيء. ولكن إذا كنت أتصفح هذه الصورة على وسائل التواصل الاجتماعي؟ من المستحيل أن أسجلها كذكاء اصطناعي. تبدو المواضيع واقعية، لكنني أعتقد أن حقيقة أن الصورة لا تبدو مثالية جدًا هو ما يجذبها.

الجبل كبير ومثير بعض الشيء، لكن الطريقة التي يتم بها عرض القارب والمياه والمدينة تشبه إلى حد كبير الطريقة التي يعرضها بها الهاتف.
الصورة: نانو الموز برو

التعرض الساطع والمسطح، وعمق المجال السخي، والتفاصيل المقرمشة قليلاً: كل ذلك يصرخ في كاميرا الهاتف بالنسبة لي. ويتفق مع هذا الرأي بن ساندوفسكي، المؤسس المشارك لتطبيق Halide الشهير لكاميرا iPhone. في الصورة التي تم إنشاؤها بواسطة الذكاء الاصطناعي لقارب العبارة أعلاه، أشار إلى “زيادة وضوح الصورة العدوانية التي تواجهها في صور الهواتف الذكية. إنها خدعة بصرية تساعد على “إبراز الصورة”.” هل هناك سمة مميزة أخرى للصور الملتقطة بالهاتف؟ ضوضاء. “معظم الصور المولدة بتقنية الذكاء الاصطناعي تبدو نظيفة للغاية. يبدو النسيج الموجود في هذه الصور وكأنه مأخوذ من مستشعر صغير للهاتف الذكي.”

عرض الذكاء الاصطناعي لمقصورة حافلة مزدحمة

حتى ركاب مترو كينغ كاونتي الذين أنشأهم الذكاء الاصطناعي يرفضون أخذ حقائب الظهر الخاصة بهم في الحافلة.
الصورة: نانو الموز برو

إذًا من أين يحصل الذكاء الاصطناعي من جوجل على مفاهيمه حول صور الهاتف؟ قد يبدو تطبيق صور Google مكانًا واضحًا – ويثير إشكالية كبيرة – لكن إيليجا لاوال، مدير الاتصالات العالمية لتطبيق Gemini، يقول: “بالنسبة لـ Nano Banana، لا نستخدم صور Google”. وأخبرني أيضًا أن Nano Banana Pro لم يتم توجيهه بشكل محدد نحو إنتاج مظهر لكاميرا الهاتف. ويقول: “أحد التحسينات الضخمة هو أنه يمكنه الاتصال ببحث Google”. إذا طلبت منه إنشاء مخطط معلوماتي حول الطقس اليوم، فيمكنه البحث عن درجة الحرارة – في السابق، كنت بحاجة إلى تضمين المزيد من هذه المعلومات في مطالبتك.

وبحسب لاوال، فإن هذا يقتصر على البحث عن النص وليس البحث عن الصور. ولكن أن تكون قادرة على ذلك اذهب واحصل على قد تكون معلومات العالم الحقيقي في حد ذاتها عنصرًا رئيسيًا هنا. يعد Nano Banana Pro جيدًا بشكل خاص في إضافة أشياء إلى الصور ذات المعنى في هذا السياق – حتى لو لم تطلبها على وجه التحديد. ويمكن إضافة عناصر تاريخية مثل الملابس والسيارات المناسبة للفترة دون أن يُطلب منك ذلك صراحةً. حتى أنه أضاف علامة مائية ل خدمة القائمة المتعددة الشمالية الغربية عندما طلبت منها إنشاء قائمة Zillow مزيفة لمنزل مزيف في سياتل. لقد أصبح فهم المهمة أفضل كثيرًا وإضافة تلك التفاصيل الصغيرة دون أن يُطلب منك ذلك.

صورة AI لمنزل على طراز حرفي

الصورة: نانو الموز برو

لقد طلبت من Gemini الحصول على قائمة Zillow لمنزل على الطراز الحرفي مع طلاء أبيض وزخرفة سوداء في غرب سياتل. لقد أعادت قائمة نصية فقط تصف المكان، ولكن مع مطالبة أخرى، استخدمت Nano Banana Pro لإنشاء صورة تتوافق مع الوصف. لم أطلب ذلك على وجه التحديد، ولكن يوجد في الصورة حقوق الطبع والنشر لعام 2023، وهو أمر مضحك للغاية، وعلامة مائية مثل تلك الموجودة بشكل أساسي في كل صورة عقارية تجدها في منطقة سياتل الكبرى. ومن المثير للاهتمام، أنه ليس الشعار الحالي – إنه الإصدار السابق، وهو نفس الشعار الموجود في كل صورة للمنزل الذي اشتريته في عام 2018.

سألت Google أين يمكن لـ Nano Banana أن يتوصل إلى ذلك، واقترحت Naina Raisinghani، مديرة منتجات DeepMind، أن الأمر كان مجرد هلوسة، وقدمت هذا البيان: “يوفر Nano Banana Pro ترقيات كبيرة لتناسق الأحرف، وتوليد الصور، والدقة المستندة إلى البحث. في حين أن هذا هو نموذج الصور الأكثر دقة لدينا حتى الآن، يمكن أن تحدث هلوسة الذكاء الاصطناعي. إذا لم تكن الصورة صحيحة تمامًا، فإننا نشجعك على إعادة المحاولة، لأن المحاولة اللاحقة غالبًا ما تؤدي إلى نتيجة أكثر انسجامًا مع نيتك.” الأمر هو أن إضافة العلامة المائية لخدمة قائمة العقارات يبدو أن النموذج يعمل تمامًا كما هو مقصود.

علامة مائية أم لا، أعتقد أن الطباعة الصغيرة الموجودة على علامة “للبيع” قد تشير إلى أن هذا هو الذكاء الاصطناعي، أو ربما تبدو النباتات الموجودة في أصص على الشرفة الأمامية مثالية بعض الشيء، ولكن بصراحة؟ أجد صعوبة في تصديق أن هذا المنزل ليس حقيقيًا، على الرغم من أنني أعرف في أعماقي أنه ليس كذلك. لن أفكر في الأمر مرة أخرى إذا عثرت عليه على أحد مواقع العقارات، ومن المؤكد أن العلامة المائية ستساعد في بيعه على أنه أصلي. إذا أصبح الذكاء الاصطناعي جيدًا في تقليد الأشياء التي تشير إلى أن الصورة حقيقية، إذن يا شباب: نحن مطبوخون.

صورة AI لمراسل في Apple Park

يقوم Nano Banana بدمج بعض الأماكن المختلفة في Apple Park هنا، ولكن الأجواء جيدة. ومن المثير للاهتمام أنه أضاف أقدم حافة الشعار هنا أيضا. يجعلك تتساءل.
الصورة: نانو الموز برو

هذا هو الأمر الأكثر إثارة للقلق بالنسبة لي: أصبح من الصعب اكتشاف ما يقوله الذكاء الاصطناعي، كما أن Nano Banana يتحسن في محاكاة التفاصيل الصغيرة التي تجعل الصورة تبدو حقيقية. لقد قدمنا ​​لها بعض المطالبات الغامضة لتصوير أ حافة مراسل يغطي حدثًا مباشرًا؛ أضافت تفاصيل مثل الميكروفون مع حافة الشعار في يد المراسل والكرون في الجزء السفلي من الشاشة. لا توجد أخطاء إملائية أو أحرف ذات مظهر غريب. لا يد بستة أصابع. لا شيء من شأنه أن يبرزها بشكل واضح على أنها ذكاء اصطناعي والكثير من التفاصيل الصغيرة لبيعها على أنها صفقة حقيقية.

قبل عام، أو حتى قبل بضعة أشهر، كان لدي شعور بأن هناك يومًا قادمًا في المستقبل، وهو اليوم الذي لن يكون من الحكمة فيه تصديق أي صورة أو مقطع فيديو رأيته عبر الإنترنت من مصدر غير مألوف ما لم يثبت خلاف ذلك. لقد أقنعني هذا التمرين أن ذلك اليوم ليس في المستقبل؛ إنه هنا الآن. اضبط رادار الذكاء الاصطناعي الخاص بك بشكل مناسب، ولا تتفاجأ إذا كان يقودك إلى القليل من الموز.

متابعة المواضيع والمؤلفين من هذه القصة لرؤية المزيد من هذا القبيل في خلاصة صفحتك الرئيسية المخصصة وتلقي تحديثات البريد الإلكتروني.




المصدر

spot_imgspot_img