انثروبي فقط صدر كلود الخرافة 5ووصفه بأنه أقوى نموذج للذكاء الاصطناعي تم توفيره على نطاق واسع على الإطلاق مدح مهاراتها في علم الأحياء، من بين أمور أخرى. لكن النموذج لن يجيب على أسئلة علم الأحياء الأساسية، وهو النوع الذي تتوقع أن يتعامل معه طالب المدرسة الثانوية. بدلاً من ذلك، يقوم بتسليم الاستعلام إلى النموذج الرئيسي السابقإغلاق العمل 4.8
ليس لأن Fable لا يعرف الإجابات. ذلك لأن الأنثروبيك لن تسمح بذلك، بحكم تصميمها.
Fable هو نموذج من فئة Mythos يواجه الجمهور، وهي عائلة قادرة جدًا على القيام بمهام الأمن السيبراني كما قالت Anthropic. خطير جدًا بحيث لا يمكن نشره علنًا. ولكن في حين أن الأنثروبيك قد قضى الكثير من طرح Mythos الممتد تحذيرًا بشأن الأمن السيبراني، فإن علم الأحياء هو المكان الذي تكون فيه حواجز حماية Fable هي الأكثر وضوحًا – والأكثر تقييدًا.
عندما جربت النموذج، رفض الإجابة على مجموعة من الأسئلة البيولوجية الأساسية، وكان العديد منها يبدو بعيدًا عن أي خطر محتمل على السلامة مثل أي سؤال. لن يستجيب لـ “أخبرني عن أغشية الخلايا” أو يجيب على “ما هي الميتوكوندريا”، تلك القوة الشهيرة للخلية. لقد رفضت شرح “ما هو البريون”، أو الجسيمات البروتينية المسببة لمرض جنون البقر، أو “كيفية عمل لقاحات mRNA”.
“لقد قمنا بهذه المقايضة حتى يتمكن العملاء من الاستفادة من قدرات النموذج في وقت أقرب دون المخاطرة.”
تنطبق القيود على الاستفسارات الطبية العادية وغير الضارة إلى حد ما بشكل موضوعي أيضًا. لن تجيب الحكاية على “أسباب حمى القش”، أو تشرح كيفية عمل أدوية الربو، أو تشرح كيف تنشأ مقاومة المضادات الحيوية، أو تخبرني ما هو الإيبولا وكيف ينتشر. أحيانًا ما أتمكن من الإجابة على بعض استفساراتي الأساسية، حيث يجيب Fable على أسئلة مثل “ما هو السرطان” و”ما هو الحمض النووي”. عندما رفضت Fable، استجابت Opus 4.8 بشكل جيد تمامًا.
تقول أنثروبيك إن مرشحات البيولوجيا الواسعة هي اختيار مقصود وهي متحفظة بشكل متعمد، حيث تكون الأسلحة البيولوجية هي الشاغل الرئيسي. وقال المتحدث بارول ماهيشواري: “مع إطلاق Claude Fable 5، وهو أول نموذج لدينا من فئة Mythos، نعتقد أن النماذج لديها الآن قدرة أكبر على إنجاز المهام العلمية في العالم الحقيقي ويمكن للجهات الفاعلة الخبيثة استخدام نماذجنا في أبحاث بيولوجية شديدة الخطورة”. الحافة. “لقد استخدمنا دائمًا المصنفات لمنع نماذجنا من المساعدة في الطلبات المتعلقة بالأسلحة البيولوجية. لنشر Fable 5 بأمان، نعتقد أنه كان من الضروري أن نكون متحفظين بشكل مفرط فيما يتعلق بالضمانات الخاصة بنا، بحيث يحظرون معظم الاستفسارات المرتبطة بالعمل البيولوجي. “
الأنثروبي قد سبق أبرز أربعة مجالات رئيسية من شأنها أن تخنق استجابات Fable للسلامة: الكيمياء، والبيولوجيا، والأمن السيبراني، والتقطير، وهي تقنية لتدريب الذكاء الاصطناعي الأصغر باستخدام مخرجات الذكاء الاصطناعي الأكبر. الشركة لديها المتهم المنافسون الصينيون مثل DeepSeek يستخدمون التقطير في نماذجهم على نطاق “صناعي”.
على الرغم من أنني لم أتمكن من اختبار التقطير بشكل هادف، إلا أن شركة Fable بدت أكثر استعدادًا للإجابة على أسئلة حول الكيمياء والأمن السيبراني. على سبيل المثال، قدمت نظرة عامة أساسية عن مادة TNT المتفجرة، على الرغم من حجب تعليمات التركيب “لأسباب واضحة”. لقد أجاب بسهولة على الأسئلة المتعلقة باستخدام غاز الكلور كسلاح كيميائي، وتهديدات كلمات المرور الشائعة، والاندماج والانشطار النووي، بالإضافة إلى شرح كيفية تأمين جهاز iPhone من المتسللين. لا يزال الأمر محدودًا: تم تأجيل الحكاية إلى Opus عندما سألتها عن غاز السارين، وهو غاز أعصاب شديد السمية. رفض كل من Fable وOpus السؤال “كيفية صنع الجمرة الخبيثة”، وأوقف كلود الدردشة مؤقتًا تمامًا. هذا منطقي. يبدو الرفض الفوري للميتوكوندريا بمثابة نتيجة إيجابية كاذبة.
وأوضح ماهيشواري: “لقد قمنا بهذه المقايضة حتى يتمكن العملاء من الاستفادة من قدرات النموذج في وقت أقرب دون التعرض للمخاطر”، مضيفًا أن Anthropic تعمل جاهدة لتحسين اكتشافها وتقليل النتائج الإيجابية الكاذبة. “نحن نعتزم إتاحة نماذج فئة Mythos دون هذه الضمانات لمجتمع علم الأحياء وعلوم الحياة الأوسع حتى يمكن استخدام هذه القدرات لتسريع الأبحاث الطبية الحيوية واكتشاف الأدوية.”
لم تجب الأنثروبيك على الأسئلة حول ما إذا كان هذا النوع من الإصدار المقيد سيصبح هو المعيار الجديد للنماذج المستقبلية.


