تقوم OpenAI وAnthropic بإجراء تعديلات على برامج الدردشة الآلية الخاصة بهما والتي يقولون إنها ستجعلها أكثر أمانًا للمراهقين. نظرًا لأن OpenAI قامت بتحديث إرشاداتها حول كيفية تفاعل ChatGPT مع المستخدمين الذين تتراوح أعمارهم بين 13 و17 عامًا، تعمل Anthropic على طريقة جديدة لتحديد ما إذا كان شخص ما دون السن القانونية.
يوم الخميس، OpenAI أعلن ذلك ChatGPT المواصفات النموذجية – المبادئ التوجيهية لكيفية تصرف برنامج الدردشة الآلي الخاص به – ستتضمن أربعة مبادئ جديدة للمستخدمين الذين تقل أعمارهم عن 18 عامًا. والآن، يهدف ChatGPT إلى “وضع سلامة المراهقين في المقام الأول، حتى عندما يتعارض ذلك مع أهداف أخرى”. وهذا يعني توجيه المراهقين نحو خيارات أكثر أمانًا عندما تتعارض اهتمامات المستخدم الأخرى، مثل “أقصى قدر من الحرية الفكرية”، مع المخاوف المتعلقة بالسلامة.
وتقول أيضًا إن ChatGPT يجب أن “يعزز الدعم في العالم الحقيقي”، بما في ذلك من خلال تشجيع العلاقات خارج الإنترنت، مع توضيح كيف يجب على ChatGPT أن يضع توقعات واضحة عند التفاعل مع المستخدمين الأصغر سنًا. تقول مواصفات النموذج أن ChatGPT يجب أن “يعامل المراهقين مثل المراهقين” من خلال تقديم “الدفء والاحترام” بدلاً من تقديم إجابات متعالية أو معاملة المراهقين مثل البالغين.
تقول OpenAI إن تحديث مواصفات نموذج ChatGPT يجب أن يؤدي إلى “حواجز حماية أقوى وبدائل أكثر أمانًا وتشجيعًا للحصول على دعم موثوق به دون اتصال بالإنترنت عندما تنتقل المحادثات إلى منطقة أكثر خطورة.” تضيف الشركة أن ChatGPT سيحث المراهقين على الاتصال بخدمات الطوارئ أو موارد الأزمات إذا كانت هناك علامات على “خطر وشيك”.
إلى جانب هذا التغيير، تقول OpenAI إنها في “المراحل الأولى” من إطلاق نموذج للتنبؤ بالعمر والذي سيحاول تقدير عمر شخص ما. إذا اكتشف أن شخصًا ما قد يكون أقل من 18 عامًا، فسوف يقوم OpenAI تلقائيًا بتطبيق إجراءات الحماية الخاصة بالمراهقين. كما أنه سيمنح البالغين الفرصة للتحقق من أعمارهم إذا تم الإبلاغ عنهم بشكل خاطئ بواسطة النظام.
الأنثروبي هو إطلاق تدابير مماثلة، حيث تعمل على تطوير نظام جديد قادر على اكتشاف “علامات المحادثة الدقيقة التي تشير إلى أن المستخدم قد يكون دون السن القانونية” أثناء المحادثات مع برنامج الدردشة الآلي الخاص بها، كلود. ستقوم الشركة بتعطيل الحسابات إذا تم التأكد من أنها مملوكة لمستخدمين أقل من 18 عامًا، وتقوم بالفعل بوضع علامة على المستخدمين الذين يعرفون أنفسهم على أنهم قاصرون أثناء المحادثات.
توضح الأنثروبيك أيضًا كيفية تدريب كلود على الاستجابة للمطالبات المتعلقة بالانتحار وإيذاء النفس، بالإضافة إلى التقدم الذي أحرزته في الحد من التملق، والذي يمكن أن يعيد التأكيد على التفكير الضار. تقول الشركة إن أحدث موديلاتها “هي الأقل تملقًا حتى الآن”، مع أداء Haiku 4.5 الأفضل، حيث صححت سلوكها المتملق بنسبة 37 بالمائة من الوقت.
يقول أنثروبيك: “من الناحية الظاهرية، يُظهر هذا التقييم أن هناك مجالًا كبيرًا للتحسين لجميع نماذجنا”. “نعتقد أن النتائج تعكس مقايضة بين الدفء النموذجي أو الود من ناحية، والتملق من ناحية أخرى.”


