Prometheus وGrafana
تغطية متقدمة: Remote Write and Long-Term Storage
Remote Write and Long-Term Storage
هذا الدرس يوسع مسار Prometheus & Grafana اعتمادًا على موضوعات التوثيق الرسمية: Prometheus and Grafana docs: scrape config, exporters, PromQL, rules, Alertmanager, dashboards, cardinality and remote write. الهدف هو تحويل Remote Write and Long-Term Storage من عنوان نظري إلى قدرة تشغيلية يمكن تطبيقها ومراجعتها في بيئة إنتاج.
اقرأ هذا الدرس كجزء من مراجعة A to Z للمسار: المفهوم، الإعداد، الأمان، التشغيل، المراقبة، وrollback.
تغطية التوثيق
- المفاهيم الأساسية والمصطلحات المرتبطة بالموضوع.
- الإعدادات والخيارات التي تظهر في التوثيق الرسمي.
- مخاطر الإنتاج وحدود المسؤولية بين الفرق.
- خطوات التحقق قبل وبعد التطبيق.
- الأخطاء الشائعة وكيفية تشخيصها.
طريقة التطبيق
- حدد مصدر الحقيقة: Git أو configuration أو API أو control plane.
- نفذ التغيير بطريقة قابلة للتكرار مع dry-run أو plan عندما يكون ذلك ممكنًا.
- اربط التغيير ببوابات CI/CD وسياسات الأمان المناسبة.
- راقب المقاييس والسجلات والأحداث بعد التطبيق.
- وثق rollback ومالك التصعيد قبل لمس الإنتاج.
curl -s https://prometheus.example.com/api/v1/query --data-urlencode 'query=up'
curl -s https://logs.example.com/health
curl -s https://tracing.example.com/api/servicesمعيار الإتقان
تتقن Remote Write and Long-Term Storage عندما تستطيع شرحه، تطبيقه، اختباره، مراقبته، واستعادته من الفشل بدون الاعتماد على خطوات يدوية غير موثقة.
تطبيق عملي: أنشئ runbook صغيرًا لهذا الموضوع يتضمن المتطلبات، الأوامر، التحقق، المخاطر، وخطة rollback.