أسس قابلية الرصد

تغطية متقدمة: Service-Level Objectives and Error Budgets

24 دقيقة الدرس 14 من 28

Service-Level Objectives and Error Budgets

هذا الدرس يوسع مسار Observability Foundations اعتمادًا على موضوعات التوثيق الرسمية: Observability docs and OpenTelemetry concepts: metrics, logs, traces, SLIs, SLOs, dashboards, alerts and correlation. الهدف هو تحويل Service-Level Objectives and Error Budgets من عنوان نظري إلى قدرة تشغيلية يمكن تطبيقها ومراجعتها في بيئة إنتاج.

اقرأ هذا الدرس كجزء من مراجعة A to Z للمسار: المفهوم، الإعداد، الأمان، التشغيل، المراقبة، وrollback.

تغطية التوثيق

  • المفاهيم الأساسية والمصطلحات المرتبطة بالموضوع.
  • الإعدادات والخيارات التي تظهر في التوثيق الرسمي.
  • مخاطر الإنتاج وحدود المسؤولية بين الفرق.
  • خطوات التحقق قبل وبعد التطبيق.
  • الأخطاء الشائعة وكيفية تشخيصها.

طريقة التطبيق

  1. حدد مصدر الحقيقة: Git أو configuration أو API أو control plane.
  2. نفذ التغيير بطريقة قابلة للتكرار مع dry-run أو plan عندما يكون ذلك ممكنًا.
  3. اربط التغيير ببوابات CI/CD وسياسات الأمان المناسبة.
  4. راقب المقاييس والسجلات والأحداث بعد التطبيق.
  5. وثق rollback ومالك التصعيد قبل لمس الإنتاج.
curl -s https://prometheus.example.com/api/v1/query --data-urlencode 'query=up'
curl -s https://logs.example.com/health
curl -s https://tracing.example.com/api/services

معيار الإتقان

تتقن Service-Level Objectives and Error Budgets عندما تستطيع شرحه، تطبيقه، اختباره، مراقبته، واستعادته من الفشل بدون الاعتماد على خطوات يدوية غير موثقة.

تطبيق عملي: أنشئ runbook صغيرًا لهذا الموضوع يتضمن المتطلبات، الأوامر، التحقق، المخاطر، وخطة rollback.