يوم الاثنين ، أطلقت Google جديدًا برنامج المكافأة مكرس على وجه التحديد لإيجاد الأخطاء في منتجات الذكاء الاصطناعي. قائمة جوجل الأخطاء المؤهلة يتضمن أمثلة على نوع الإجراءات المارقة التي يبحث عنها ، مثل حقن مطالبة AI بشكل غير مباشر والتي تتسبب في فتح Google Home من الباب ، أو حقن موجه للبيانات الذي يلخص جميع بريد إلكتروني شخص ما ويرسل الملخص إلى حساب المهاجم الخاص.
يوضح البرنامج الجديد ما الذي يشكل حشرة الذكاء الاصطناعى ، أو تقسيمها كمسائل تستخدم نموذج لغة كبير أو نظام AI التوليدي للتسبب في ضرر أو الاستفادة من ثغرة أمان ، مع إجراءات Rogue في الجزء العلوي من القائمة. يتضمن ذلك تعديل حساب أو بيانات شخص ما لإعاقة أمنه أو القيام بشيء غير مرغوب فيه ، مثل عيب واحد مكشوف من قبل يمكن أن يفتح مصاريع ذكية وإطفاء الأنوار باستخدام حدث تقويم Google المسموم.
ببساطة الحصول على الجوزاء إلى الهلوسة لن يقطعها. تقول الشركة تلك القضايا المتعلقة بالمحتوى يجب أن يتم الإبلاغ عن قناة التعليقات داخل المنتج نفسه التي تنتجها منتجات الذكاء الاصطناعى-مثل توليد خطاب الكراهية أو محتوى حقوق الطبع والنشر-إلى قناة التغذية المرتدة داخل المنتج نفسه. وفقًا لـ Google ، يمكن لفرق أمان AI بهذه الطريقة “تشخيص سلوك النموذج وتنفيذ التدريب على السلامة على مستوى النموذج على مستوى النموذج.”
جنبا إلى جنب مع برنامج مكافأة الذكاء الاصطناعى الجديد ، أعلنت Google أيضًا يوم الاثنين عن وكيل الذكاء الاصطناع CodeMender. تقول الشركة إنها استخدمت لتصحيح “72 إصلاحًا للأمن لفتح المصادر” بعد فحصه من قبل باحث بشري.
تُمنح جائزة بقيمة 20.000 دولار لتوصيل الإجراءات المارقة على البحث عن المنتجات “الرائدة” من Google ، وتطبيقات الجوزاء ، وتطبيقات مساحة العمل الأساسية مثل Gmail و Drive. مضاعفات لجودة التقرير و مكافأة الجدة متوفرة أيضًا ، والتي يمكن أن تصل المبلغ الإجمالي إلى 30،000 دولار. انخفاض الأسعار للأخطاء الموجودة على منتجات Google الأخرى ، مثل Jules أو NotebookLM ، وللتعلقات ذات المستوى الأدنى ، مثل سرقة المعلمات النموذجية السرية.


