أصبحت Cloudflare أحدث عملاق البنية التحتية للويب الذي ينهار في غضون شهر واحد، استبدال المواقع بأكملها، بما في ذلك X وChatGPT وSpotify وCanva وحتى DownDetector لتتبع انقطاع الخدمة، مع ظهور رسالة خطأ لساعات هذا الصباح. إنه الأحدث في سلسلة من الانقطاعات التي يقول مهدي الداودي، الرئيس التنفيذي والمؤسس المشارك لمنصة مراقبة أداء الإنترنت Catchpoint، إنها يجب أن تكون بمثابة “جرس تنبيه” للشركات.
يقول الداودي: “يضع الجميع كل بيضهم في سلة واحدة، ثم يتفاجأون عندما تكون هناك مشكلة”. “من جانب الشركة التأكد من أن لديهم التكرار والمرونة.”
انقطاع يأتي بعد المشاكل التي تؤثر على مايكروسوفت أزور و وقعت خدمات الويب الأمازون في غضون أسبوع واحد فقط من بعضها البعض، مما يؤدي إلى قطع أجزاء كبيرة من الإنترنت التي تعتمد على مقدمي الخدمات الرئيسيين للحفاظ على تشغيل مواقعها على الويب. وبالمثل، تعمل Cloudflare على تشغيل جزء كبير من الإنترنت. إنها تحافظ على مواقع الويب عبر الإنترنت من خلال شبكة توصيل المحتوى الخاصة بها، بينما تقدم العديد من الخدمات الأخرى، بما في ذلك الحماية من هجمات DDoS و DNS. في العام الماضي، قالت الشركة يتم تشغيل حوالي 20 بالمائة من الويب عبر شبكة Cloudflare. كما أنها تخدم 35 بالمئة من الشركات المدرجة في قائمة فورتشن 500، بالإضافة إلى “ملايين” العملاء الآخرين.
أداء Cloudflare السريع وسجل الأمان يجعلها خيارًا شائعًا لمواقع الويب في جميع أنحاء العالم، ولكن هذا الانقطاع الأخير يلفت الانتباه إلى مدى التركيز الذي أصبحت عليه صناعة البنية التحتية للويب. بعد أن أدى انقطاع خدمة AWS إلى تعطيل تطبيق المراسلة الآمن Signal، قامت رئيسة الخدمة، ميريديث ويتاكر، قالت الشركة لم يكن أمامه أي خيار آخر سوى الاستعانة بمزود خدمة سحابية رئيسي للتشغيل. وكتبت: “المكدس بأكمله، من الناحية العملية، مملوك لـ 3-4 لاعبين”.
“حتى الانحرافات الصغيرة يمكن أن يكون لها عواقب كبيرة.”
ولكن حتى مع اعتماد الشركات على عدد قليل فقط من موفري البنية التحتية للويب، فإن السلسلة الأخيرة من الانقطاعات توضح أنها بحاجة إلى خطة احتياطية. يقول الداودي: “ستكون هناك انقطاعات في الكهرباء، وسوف تستمر في الحدوث بشكل متكرر. وسيستمر نطاق الانفجار في التزايد”. الحافة. “السؤال هو، ماذا تفعل حيال ذلك؟”
على الرغم من أن Microsoft وAWS ربطتا انقطاعات الخدمة الخاصة بهما بالمشكلات المتعلقة بـ DNS – وهو نظام يترجم أسماء نطاقات مواقع الويب إلى عناوين IP – فقد تتبعت Cloudflare انقطاعها في ملف واحد. وقال جاكي داتون، المتحدث باسم Cloudflare: “السبب الجذري للانقطاع هو ملف التكوين الذي يتم إنشاؤه تلقائيًا لإدارة حركة مرور التهديدات”. “لقد تجاوز حجم الملف الحجم المتوقع للإدخالات وأدى إلى تعطل نظام البرنامج الذي يتعامل مع حركة المرور لعدد من خدمات Cloudflare.”
قد يبدو من السخيف أن تؤدي مشكلة مثل هذه في ملف إلى تعطيل مساحات كبيرة من الإنترنت، ولكن بالنسبة للشركات الكبيرة مثل Cloudflare، يمكن أن يحدث ذلك. يقول روب لي، رئيس قسم الذكاء الاصطناعي والأبحاث في معهد SANS: “عندما تقوم بتشغيل البنية التحتية على نطاق Cloudflare، فإن الانحرافات الصغيرة حتى يمكن أن يكون لها عواقب كبيرة”. الحافة. “تم تصميم هذه المنصات من أجل السرعة، لذا فإن أي شيء يؤخر أو يوقف اتخاذ القرار يمكن أن يتسلسل بسرعة. وفي البيئات عالية الأداء، يمكن أن يصبح التأخير بالمللي ثانية بمثابة توقف كامل لحركة المرور.”
وفقًا لـ Lee، فإن ملف التكوين مثل ذلك الذي تصفه Cloudflare “يحرك سياسات أمان التوجيه، وقرارات موازنة التحميل، وكيفية توزيع حركة المرور عالميًا.” ويضيف لي أنه إذا زاد حجم الملف فجأة، “فمن الممكن أن يؤدي ذلك إلى عملية تحليل أبطأ، أو مشاكل في الذاكرة، أو تنافس على وحدة المعالجة المركزية، أو فشل منطقي داخل الأنظمة التي تعتمد عليه”.
بالمثل، ألقت AWS باللوم على “الأتمتة الخاطئة” في إطلاق سلسلة من المشكلات التي أدت إلى انقطاع الخدمة على نطاق واسع مؤخرًا – وهو نوع الخطأ الذي لا بد أن يحدث مرة أخرى. “هل ستشتكي من ذلك في كل مرة يعطس فيها Cloudflare؟” يقول الداودي. “أم أنك ستبني حوله؟”


