
المهندس محمد عبده يكتب : كيف نحافظ على استمرارية خدماتنا الرقمية في حال تعطل أكبر مزودي الخدمة بالعالم
أصبحت البنية التحتية السحابية قلب معظم المواقع والخدمات الرقمية. غير أنّ الاعتماد الكلّي على مزوّد واحد يضعنا تحت رحمة أعطاله؛ فما إن يتعثر مزوّد رئيسي حتى ينعكس ذلك فوراً على تجربة المستخدم وربما على سمعة المؤسسة وإيراداتها. الانقطاع الواسع الذي أصاب Google Cloud في 12 يونيو 2025 وأثّر في خدمات كبرى يذكّرنا بحجم الخطر الكامن في «نقطة فشل واحدة». في المقابل، تُظهر لوحات حالة مزوّدين آخرين أن بعضهم كان «جميع أنظمته تعمل»، ما يبرهن جدوى توزيع الأعباء عبر أكثر من سحابة.
2. أبرز نقاط الضعف عند الاعتماد على مزوّد واحد
المكوّن أثر العطل مثال حي من انقطاع 12 يونيو 2025
إدارة الهويات (IAM) توقف المصادقة والتفويض يعطّل جميع واجهات API السبب الأساسي في الحادث الأخير
الشبكات و DNS فقدان القدرة على حلّ النطاقات أو تمرير الترافك تعطل كل الخدمات الأمامية
التخزين المستمر (Persistent Disk) توقف قواعد البيانات وحاويات التطبيقات توقف قواعد بيانات إنتاجية
3. إستراتيجيات الحد من المخاطر
المجال خطوات عملية للتنفيذ
المزودات المتعدّدة (Multi-Cloud) • نشر الخدمات الحرجة في مزوّدين على الأقل.
• توحيد النشر عبر الحاويات و Terraform لضمان قابلية النقل.
التوزيع الجغرافي (Multi-Region) • تفعيل مناطق احتياطية داخل المزوّد ذاته مع ضبط الـ Failover.
• استخدام قواعد بيانات موزّعة أو نسخ احتياطي متماثل.
أتمتة التعافي • إعداد موازنات تحميل مع فحوصات صحّة دقيقة.
• استخدام DNS موزّع مع سجلّات Failover و TTL منخفض.
التخزين والنسخ الاحتياطي • جداول snapshots تلقائية وتخزين نسخ خارج المزوّد.
المراقبة والتنبيه • دمج واجهات حالة المزوّدين في لوحة عمليات موحّدة.
• الاعتماد على أدوات مراقبة خارجية مستقلّة.
الاختبار الدوري (Chaos / DR Drills) • تنفيذ تجارب فوضى صغيرة للتأكد من جاهزية الفريق والنظام.
4. مسار استجابة للحوادث (Incident Runbook)
الكشف السريع: تنبيهات فورية عند تجاوز عتبة الخطأ أو تغيّر حالة الخدمة.
التقييم: تحديد نطاق التأثير (مستخدمون، معاملات مالية، بيانات).
الاحتواء: تشغيل خطة Failover أو الانتقال إلى مزوّد بديل.
التواصل: نشر تحديثات شفافة على صفحة حالة الموقع ووسائل التواصل.
التعافي: إعادة الخدمات الأصلية بعد ثبات المزوّد وإجراء اختبار سلامة.
التعلّم: عقد Post-mortem شامل لتوثيق السبب الجذري ومنع تكراره.
المهندس/ محمد عبده سعد
معيد، كلية علوم الحاسب – جامعة باديا
الرابط المختصر للخبر:
https://filgamaa.com/dLJMSB