Yardım merkezi

Sürüm 2026-06-20-v2 · Operasyon ve mühendislik

Olay Müdahale Runbook

**Sürüm:** 2026-06-20-v1

Güvenlik odaklı detay: `docs/production/runbooks/security-incident-response.md`

Tetikleyiciler

  • Monitoring alert (Functions error, Firestore latency, queue backlog)
  • Müşteri P0 bildirimi
  • Deploy sonrası regresyon
  • Ödeme webhook hatası dalgası
  • Adımlar

    1. Triage (0–15 dk)

  • Severity belirle (P0–P3)
  • Etkilenen tenant/event listele
  • `#incidents` kanalında incident commander ata
  • 2. İletişim (15–30 dk)

  • Müşteriye ilk yanıt (SLA tablosuna göre)
  • Status page güncelle (varsa)
  • Mühendislik war room
  • 3. Müdahale

    | Senaryo | Aksiyon |
    |---|---|
    | Functions hatası | Rollback revision / hotfix |
    | Rules bypass | Rules hotfix deploy |
    | Queue birikimi | Admin entegrasyon → kuyruk işle |
    | Veri kaybı | Firestore export restore dry-run |

    4. Kapanış

  • Post-mortem (5 iş günü içinde)
  • Release gate maddeleri güncelle
  • Müşteri özeti
  • Eskalasyon

    1. On-call mühendis

    2. Engineering lead

    3. CTO / Product owner