Логотипbitrix-code
Производительность

Observability для Битрикс24: логи, метрики, трейсы

Елена Зарубина, DevOps10 мин

Когда что-то идёт не так, observability превращает "ничего не работает" в конкретную проблему. Собираем стек.

Логи — Loki + Promtail

Promtail читает логи PHP, nginx, MySQL, пересылает в Loki. Запросы к логам через Grafana с LogQL.

Метрики — Prometheus

Экспортеры для каждого компонента. Grafana дашборды. Alertmanager для алертов в Telegram/Slack.

Трейсы — Jaeger / Tempo

Инструментация PHP через OpenTelemetry. Видим полный путь запроса через все слои: nginx → PHP → MySQL → Redis.

Корреляция

Сквозной correlation-id через все слои: от заголовка HTTP до записи в логах. Один запрос = один ID в логах, метриках, трейсах.

Retention

Логи — 30 дней горячие, 90 дней холодные. Метрики — 1 год. Трейсы — 7 дней (дорого хранить).

SLO-based мониторинг

Не алерты на каждый сбой, а на нарушение SLO (error budget). Меньше шума, более осмысленные алерты.