Производительность
Observability для Битрикс24: логи, метрики, трейсы
Елена Зарубина, DevOps10 мин
Когда что-то идёт не так, observability превращает "ничего не работает" в конкретную проблему. Собираем стек.
Логи — Loki + Promtail
Promtail читает логи PHP, nginx, MySQL, пересылает в Loki. Запросы к логам через Grafana с LogQL.
Метрики — Prometheus
Экспортеры для каждого компонента. Grafana дашборды. Alertmanager для алертов в Telegram/Slack.
Трейсы — Jaeger / Tempo
Инструментация PHP через OpenTelemetry. Видим полный путь запроса через все слои: nginx → PHP → MySQL → Redis.
Корреляция
Сквозной correlation-id через все слои: от заголовка HTTP до записи в логах. Один запрос = один ID в логах, метриках, трейсах.
Retention
Логи — 30 дней горячие, 90 дней холодные. Метрики — 1 год. Трейсы — 7 дней (дорого хранить).
SLO-based мониторинг
Не алерты на каждый сбой, а на нарушение SLO (error budget). Меньше шума, более осмысленные алерты.
bitrix