Производительность
Обработка ошибок и мониторинг Битрикс24
Елена Зарубина, DevOps11 мин
Битрикс24 упал, а вы узнали об этом от клиентов? Плохо. Разбираем, как устроить проактивный мониторинг.
Уровни мониторинга
- Инфраструктура — Prometheus + node_exporter
- Приложение — PHP, MySQL, Redis метрики
- Бизнес — поток заявок, лидов, сделок
- Пользователи — page speed, ошибки JS
Sentry для ошибок
Устанавливаем Sentry агент в Битрикс24 (инструментируем set_error_handler). Все 500-ки автоматически попадают с stack trace.
Prometheus метрики
Экспортер php-fpm_exporter, mysqld_exporter, redis_exporter. Дашборд Grafana с ключевыми показателями.
Алерты в Telegram
Alertmanager отправляет в Telegram-бот команды: 5xx rate, latency p95, lag репликации MySQL, свободное место на дисках.
Health-check эндпоинт
Отдельный URL /health, проверяет БД, Redis, внешние сервисы. Мониторинг (UptimeRobot, Better Stack) стучится раз в минуту.