تطلق Anthropic نسخة Claude Opus 4.8 يوم الخميس، وتروج الشركة لـ “صدق” النموذج.
حسب إلى الأنثروبيفهي تدرب “جميع نماذجها على أن تكون صادقة – على سبيل المثال، لتجنب تقديم ادعاءات لا يمكنها دعمها”. لكنها تشير إلى أن “المشكلة العامة في نماذج الذكاء الاصطناعي هي أنها تقفز أحيانًا إلى الاستنتاجات، وتقدم عملها بثقة على أنه يحقق تقدمًا على الرغم من قلة الأدلة”.
يدعي مختبر الذكاء الاصطناعي أن المختبرين الأوائل وجدوا أن Opus 4.8 “من المرجح أن يشير إلى الشكوك حول عمله وأقل احتمالاً لتقديم ادعاءات غير مدعومة”. في تقييمات الشركة، يعتبر Opus 4.8 “أقل احتمالًا بحوالي 4 مرات من سابقه للسماح بالعيوب في التعليمات البرمجية المكتوبة دون ملاحظة.”
بالإضافة إلى تحسينات الصدق، مع Opus 4.8، يمكن للمستخدمين توجيه مقدار الجهد الذي يبذله كلود في المهمة. ستستخدم الاستجابات ذات الجهد العالي عددًا أكبر من الرموز، مما يمنح المستخدمين خيار الاستجابات ذات الجهد الأقل إذا كانوا لا يريدون تجاوز حدود المعدلات الخاصة بهم بالسرعة نفسها.
تطلق Anthropic أيضًا ميزة تسمى “سير العمل الديناميكي” في معاينة البحث، والتي تقول الشركة إنها ستسمح لكلود “بتولي مهام أكبر”. باستخدام سير العمل الديناميكي، “يستطيع كلود تخطيط العمل ثم تشغيل مئات الوكلاء الفرعيين المتوازيين في جلسة واحدة (ومع Opus 4.8، يمكن للوكلاء العمل لفترة أطول). ثم يتحقق من مخرجاته قبل تقديم تقرير إلى المستخدم.”


