اتخذ طرح Anthropic الخاضع لرقابة مشددة لـ Claude Mythos منعطفًا غريبًا. بعد قضاء أسابيع في الإصرار على أن نموذج الذكاء الاصطناعي قادر جدًا على الأمن السيبراني لدرجة أنه من الخطورة جدًا نشره علنًا، يبدو أن هذا النموذج هو النموذج سقطت في الأيدي الخطأ على أي حال.
وفق بلومبرج، تمكنت “مجموعة صغيرة من المستخدمين غير المصرح لهم” من الوصول إلى Mythos – الذي وجود كان الأول مكشوف في تسرب – منذ اليوم الذي أعلنت فيه الأنثروبيك خطط لعرضه على مجموعة مختارة من الشركات للاختبار. تقول الأنثروبيك إنها تحقق. هذه نظرة تقريبية لشركة قامت ببناء علامتها التجارية على أخذ سلامة الذكاء الاصطناعي على محمل الجد بينما تروج لبراعة الأمن السيبراني لأحدث طراز لها.
من وجهة نظر تكنولوجية، يعتبر اختراق ميثوس غير معقد إلى حد محرج. بلومبرج تشير التقارير إلى أن المجموعة تمكنت من الوصول إلى Mythos من خلال إجراء “تخمين مدروس حول موقع النموذج عبر الإنترنت”، وذلك باستخدام معلومات حول نماذج Anthropic الأخرى التي تم الكشف عنها في انتهاك ميركور – شركة تصنع بيانات التدريب على الذكاء الاصطناعي – إلى جانب الوصول الذي كان يتمتع به أحد الأعضاء من خلال العمل التعاقدي لتقييم النماذج الإنسانية. حصلت المجموعة على وصول غير مصرح به إلى Mythos من خلال مزيج من المعرفة الداخلية والتخمين المحظوظ، وليس من خلال استغلال تكنولوجي متطور أو سرقة النموذج بالجملة.
إن الثغرات الأمنية أمر لا مفر منه، وكانت شركة Mercor، وليس Anthropic، هي التي كشفت المعلومات التي استخدمها المتسللون لتخمين موقع Mythos. أخبرتني بيا هوش، وهي زميلة باحثة في المعهد الملكي للخدمات المتحدة (RUSI)، وهو مركز أبحاث بريطاني، أنه لا توجد شركة آمنة بشكل كامل على الإطلاق وأن البشر غالبا ما يكونون الحلقة الأضعف، على الرغم من أنه “يبدو في البداية محظوظا بعض الشيء” لعدم وجود عواقب وخيمة.
لقد فشلت الأنثروبيك في توقع نوع من الفشل “يمكن تخيله تمامًا”.
لكنه ليس حظا سيئا تماما. هذه الأنواع من التخمينات المدروسة هي أسلوب قرصنة قياسي جدًا، وكان اختراق Mercor معروفًا بالفعل قبل إصدار Mythos. وصف لي الباحث الأمني لوكاس أولينيك هذا الأمر بأنه نوع من الفشل “الذي يمكن تصوره تمامًا” والذي كانت صناعة الأمن السيبراني تتعامل معه بشكل روتيني على مدار العشرين عامًا الماضية. لذا كان ينبغي لشركة أنثروبيك أن تتوقع ذلك وأن تستعد وفقًا لذلك، خاصة مع علمها بأن معلوماتها قد تم اختراقها.
يبدو أيضًا أن الأنثروبي كان لديه الوسائل اللازمة لاكتشاف الاختراق. وقال أوليجنيك إن الشركة قادرة على “تسجيل وتتبع استخدام النموذج”، الأمر الذي من شأنه أن يجعل من الممكن إيقاف الوصول غير المصرح به أو الضار، خاصة وأن طرح Mythos كان من المفترض أن يكون محدودًا للغاية. من الواضح أن الأنثروبيك لم تكن تراقب عن كثب بما فيه الكفاية، ونظرًا لمدى خطورة النموذج، فمن المنطقي أن نتساءل عن السبب.
بواسطة بلومبرج على الرغم من أن المجموعة لم تكن تستخدم Mythos في مهام الأمن السيبراني، ويرجع ذلك جزئيًا إلى أنهم أرادوا فقط العبث بالنموذج الجديد وجزئيًا لأن القيام بذلك كان من الممكن أن يؤدي إلى إبعاد Anthropic. إذا أردنا أن تؤخذ رسائل الأنثروبيين المحيطة بـ Mythos على محمل الجد، فهذا يعد بمثابة استراحة محظوظة. الشركة لديها مؤطر Mythos باعتبارها “لحظة فاصلة للأمن”، زاعمة أنها وجدت نقاط ضعف في “كل نظام تشغيل رئيسي ومتصفح ويب”، وقالت إن إصدارها يجب أن يتم تنسيقه لإتاحة الوقت “لتعزيز الدفاعات السيبرانية في العالم”.
لدى الأنثروبيين عادة استخدام لغة درامية ومثيرة للقلق قد يكون من الصعب استجوابها بشكل واضح، بما في ذلك المغازلة بفكرة أنه قد يكون نموذج كلود واعيًا. ومع ذلك، تشير التقارير الأولية الواردة من الأطراف التي لديها إمكانية الوصول إلى أن ميثوس ماهر بشكل خاص في مجال الأمن السيبراني. موزيلا CTO بوبي هولي قال لقد عثرت على مئات الأخطاء في Firefox 150 وقد تمنح المدافعين أخيرًا فرصة لتحقيق النصر الكامل على المهاجمين. بشكل غير مفاجئ، الحكومات و المؤسسات المالية وكان جميع أنحاء العالم حريصين على وضع أيديهم عليه. وكالة الأمن القومي والوكالات الأمريكية الأخرى يقال الوصول إليها على الرغم من الأنثروبيين التصنيف كمخاطر سلسلة التوريد، على الرغم من الطرح يبدو أنه تجاوز وكالة الأمن السيبراني الأمريكية، CISA، حتى الآن.
“تدعي الأنثروبيك أنها في الطليعة المطلقة لكل هذه التقنيات، ولكنها تضع نفسها أيضًا كجهة فاعلة مسؤولة في كل هذا.”
حقيقة أن الاختراق تم اكتشافه من قبل مراسل وليس أنثروبي يثير أيضًا سؤالًا واضحًا حول ما إذا كان حادثًا معزولًا. وقال هوش: “إنه يوضح مدى اتساع دائرة الأشخاص الذين قد يكونون قادرين على القيام بذلك، حتى لو لم يكن لديهم وسائل فائقة التطور من الناحية التقنية”. من المرجح أن تقوم شركة Anthropic بتمشيط سلسلة التوريد الخاصة بها لمعرفة كيف حدث هذا وسد الفجوات، لكنها قالت إن هناك مجموعة واسعة من الجهات الفاعلة التي ترغب في الوصول إلى نموذج مثل هذا، وبعضهم لديه قدر كبير من المال وراءه. ولا يوجد سبب للاعتقاد بأن أي شخص آخر تمكن من الوصول سيكون مقيدا مثل المجموعة بلومبرج ذكرت يوم.
لقد أطلقت الإنسانية، إلى حد ما، النار على قدمها. لقد قامت الشركة ببناء هويتها حول أخذ سلامة الذكاء الاصطناعي على محمل الجد أكثر من منافسيها، مما خلق توقعات عالية جدًا لأمن النماذج التي تتعارض مع إهمالها الواضح؛ حقيقة أن Mythos قد تم الكشف عنها من خلال مثل هذا الفشل الأساسي والمتوقع تؤكد ذلك فقط. والأسوأ من ذلك، من خلال الترويج لـ Mythos باعتبارها أداة قوية بشكل غير عادي وخطيرة جدًا للنشر العام، حولتها Anthropic إلى هدف واضح، سواء للجهات الفاعلة الخبيثة أو المتسللين الذين يبحثون ببساطة عن التحدي.
هذا ليس حتى أول حادث أمني محرج حول ميثوس. تم الكشف عن وجود النموذج عن طريق الخطأ قبل إصداره من خلال “مجموعة البيانات غير الآمنة“على نظام مركزي يحتوي على محتوى لموقعها على الويب. الآن، تم الوصول إلى هذا النموذج سرًا عبر ثغرة أمنية يمكن التنبؤ بها بالكامل لم تفكر الأنثروبي في تصحيحها. الكمال مستحيل، ولكن بالنسبة لشركة جعلت نفسها في طليعة سلامة الذكاء الاصطناعي، فمن الصعب تبرير مثل هذا الخطأ الأساسي، حتى مع بعض الحظ السيئ الذي واجهته.
بالنسبة لهوش، يمكن تلخيص الحادثة بأكملها في كلمة واحدة: الإذلال. وقالت: “تدعي الأنثروبيك أنها في الطليعة المطلقة لكل هذه التقنيات، ولكنها تضع نفسها أيضًا كجهة فاعلة مسؤولة في كل هذا”. “حقيقة أنه تم الوصول إلى هذا الآن من خلال وسائل غير مصرح بها بهذه السرعة، ومن خلال مثل هذه المحاولة غير المعقدة، هو في الواقع إذلال لهم”.


