spot_img

ذات صلة

جمع

مراجعة وحدة التحكم Arturia MiniLab 37 MIDI: إمكانية اللعب وإمكانية النقل

لقد اختبرت أكثر وحدات تحكم MIDI المحمولة مما يمكنني...

ذهبت إلى الغابة لأشرب قهوة الإسبريسو الرائعة بشكل مدهش

مع عودة الصيف، أتذكر مرة أخرى حدودي عندما أتوجه...

أنثروبيك تعتذر عن حواجز حماية كلود فابل غير المرئية

لقد اعتذرت الأنثروبيك عن اختناقها خلسة نموذج الذكاء الاصطناعي...

تطلق Deezer كاشف موسيقى يعمل بالذكاء الاصطناعي لخدمات البث الأخرى

وقال Alexis Lanternier، الرئيس التنفيذي لشركة Deezer، في بيان...

لن تجيب الخرافة على أسئلة علم الأحياء الأساسية

انثروبي فقط صدر كلود الخرافة 5ووصفه بأنه أقوى نموذج...

أنثروبيك تعتذر عن حواجز حماية كلود فابل غير المرئية


لقد اعتذرت الأنثروبيك عن اختناقها خلسة نموذج الذكاء الاصطناعي الجديد، Claude Fable 5، مع حواجز حماية مخفية تقوض الباحثين والمنافسين الذين يستخدمونها لتطوير أنظمة منافسة. وتقول الشركة إنها تعكس مسارها وستكون أكثر شفافية بشأن موعد بدء القيود، حتى لو كان ذلك يعني أن Fable ترفض المزيد من الاستفسارات.

Fable هو النموذج الأول المتاح على نطاق واسع في فئة Anthropic’s Mythos لأنظمة الذكاء الاصطناعي، وهي مجموعة أمضت الشركة أشهرًا في التحذير منها خطير جدًا للنشر العام. تقول شركة Anthropic إنها عالجت بعض هذه المخاطر من خلال إطلاق Fable مع ضمانات تمنعها من الاستجابة لبعض الاستفسارات “عالية المخاطر”. واحدة من المناطق الأنثروبيه قال من شأنه أن يقيد استجابات Fable هو التقطير، وهي تقنية لتدريب نماذج الذكاء الاصطناعي الأصغر باستخدام مخرجات النماذج الأكبر.

في بطاقة نظام Fable – وثيقة عامة أصدرها مطورو الذكاء الاصطناعي لشرح كيفية عمل النظام – قالت Anthropic إنها ستتعامل مع الاستفسارات التي تعتقد أنها محاولات التقطير عن طريق تغيير إجابات النموذج وتدهورها مباشرة. ولن يتم إخطار المستخدمين بأنهم قد قاموا بتفعيل إجراء السلامة أو إبلاغهم بأن الردود قد تم تغييرها.

أنثروبي قال إنها الآن تغير أسلوبها في التقطير: ستعود الاستعلامات الآن إلى Claude Opus 4.8، Anthropic’s النموذج الرئيسي السابققالت الشركة في منشور على X. ستخبر Anthropic المستخدمين بشكل بارز أيضًا: “سترون هذا في كل مرة يحدث فيها ذلك”.

وهذا مشابه لكيفية تعامل Fable مع الاستعلامات في المناطق الأخرى عالية المخاطر. عندما يتم تشغيل ميزات السلامة في مجالات مثل الأحياء والكيمياء والأمن السيبراني، يتم توجيه الاستعلامات من خلال Opus 4.8 ما لم يتم حظرها تمامًا بموجب قواعد السلامة الأوسع للشركة، مثل تلك التي تغطي المخدرات أو الأسلحة أو أي محتوى محظور آخر. في بعض الحالات، ولا سيما علم الأحياء، تمت معايرة الضمانات على نطاق واسع جدًا مثل Fable غير صالحة للاستعمال عمليا حتى للاستعلامات الأساسيةوهو شيء اعترف به الأنثروبي في تعليق على الحافة.

وكتبت أنثروبيك: “يمكن التحقق من الضمانات المرئية، لذلك يجب أن تكون قوية، الأمر الذي يستغرق وقتًا طويلاً حتى يصبح صحيحًا”. “يمكن استهداف الضمانات غير المرئية بشكل أضيق، مما يسمح لنا بالشحن بسرعة مع عدد قليل جدًا من النتائج الإيجابية الكاذبة. لقد اخترنا ضمانات غير مرئية لهذا السبب – وكانت تلك مقايضة خاطئة. يجب أن تكون لديك رؤية واضحة للضمانات التي لدينا، ولماذا. نحن نأسف لعدم تحقيق التوازن الصحيح.”

التغيير يتبع رد فعل عنيف مكثف من مجتمع أبحاث الذكاء الاصطناعي بشأن قرار Anthropic بالحد بصمت من المستخدمين المشتبه في محاولتهم تحويل Fable إلى نماذج منافسة – وهي حماية حذر النقاد من أنها قد تؤثر أيضًا على أطراف ثالثة تحاول تقييم النموذج الحدودي. في بطاقة النظام، قالت Anthropic إن قدرة النماذج الأحدث على تسريع تطوير الذكاء الاصطناعي تبرر استهداف تلك الطلبات، مشيرة إلى أن “استخدام Claude لتطوير نماذج منافسة ينتهك بالفعل شروط الخدمة الخاصة بنا”. الأنثروبي قد سبق المتهم المنافسون الصينيون، مثل DeepSeek، يقومون بتقطير نماذجهم بشكل غير عادل على نطاق “صناعي”.



المصدر

spot_imgspot_img