[Лаба] Prometheus + Grafana для системного аналитика: метрики и наблюдаемость
4000,00
р.
р.
Зарегистрироваться на обучение
■ За 4 часа вы научитесь
превращать общие требования в конкретные цифры— от «система должна работать быстро» к «ответ за 300 миллисекунд при 500 запросах в секунду»
понимать реальное состояние системы -сколько запросов обрабатывается, какой процент ошибок, как быстро отвечает API
создавать панели мониторинга для документирования— визуальные требования, которые понятны и команде, и заказчику
настраивать автоматические уведомления— система сама сообщит о проблемах до жалоб пользователей
формулировать реалистичные целевые показатели— на основе реальных данных, а не пожеланий заказчика
анализировать инциденты по графикам— быстро находить причину проблем по метрикам
■ Зачем участникам эта лабораторная
Как системный аналитик, вы часто слышите: «система тормозит», «иногда не работает», «не справляется с нагрузкой». Но что это значит в цифрах? Как проверить, что после релиза стало лучше, а не хуже?
В этой лабораторной вы научитесь работать с конкретными метриками системы, создавать понятные графики для контроля требований и настраивать уведомления о проблемах. Это практический навык, который сразу применим в работе.
■ Что такое Prometheus и Grafana (вкратце)
Prometheus — система, которая собирает и хранит метрики (цифровые показатели работы системы).
Grafana — инструмент для создания графиков и панелей мониторинга из этих метрик.
Вместе они дают полную картину: сбор данных → хранение → красивые графики → уведомления о проблемах.
■ Для кого
Системные и бизнес-аналитики, архитекторы решений, владельцы продукта — все, кто:
Пишет нефункциональные требования
Участвует в приемке релизов
Объясняет заказчику состояние системы
Анализирует инциденты
Не нужно: быть программистом или администратором. Нужно: понимать, что такое API и HTTP-запросы, иметь опыт работы с требованиями.
■ Что вы сделаете за 4 часа
Блок 1: Запуск и знакомство (30 мин) Запустите готовый стенд с тестовым API интернет-магазина. Разберете, какие бизнес-требования превращаются в какие метрики (например, «быстрая работа» → время ответа). Блок 2: Основы метрик (45 мин) Изучите 3 основных типа показателей: счетчики, текущие значения, распределения. Напишете первые запросы для получения данных: количество запросов в секунду, процент ошибок, время ответа. Найдете самый медленный метод API. Блок 3: Создание панели мониторинга (60 мин) Соберете панель «Взгляд аналитика» с 6 графиками: — Количество запросов в секунду — Процент ошибок — Время ответа (95-й процентиль) — Топ-5 самых используемых методов — Количество созданных заказов — Время работы системы Блок 4: Целевые показатели системы (30 мин) Разберете, что такое SLA/SLO в понятных терминах. На основе текущих данных сформулируете реалистичные целевые показатели с запасом на деградацию. Блок 5: Продвинутые возможности (45 мин) Добавите фильтры для анализа отдельных методов, отметки релизов на графиках, сравнение показателей разных версий. Организуете панели по папкам. Блок 6: Настройка уведомлений (45 мин) Настроите правила оповещений: система медленно отвечает, много ошибок, сервис недоступен. Подключите отправку в Telegram. Проверите, что уведомления приходят. Блок 7: Работа с инцидентами (30 мин) Симулируете 3 типичные проблемы: замедление API, рост ошибок, падение сервиса. Отработаете анализ: получение уведомления → изучение графиков → поиск причины. Блок 8: Подготовка к реальной работе (15 мин) Обсудите, как внедрить это в своих проектах: где хранить данные, как разграничить доступ, как интегрировать с другими системами.
■ Компетенции, которые вы прокачаете
Формулирование измеримых требований — переводить «быстро и надежно» в конкретные цифры
Чтение метрик — понимать, что показывают разные типы графиков
Создание информативных панелей — визуализировать требования и их выполнение
Работа с целевыми показателями — устанавливать реалистичные SLA на основе данных
Настройка мониторинга — получать уведомления о проблемах вовремя
Анализ инцидентов — быстро находить причины проблем по графикам
■ Что получите «на руки»
📦 Готовый стенд — все компоненты в Docker, запускается одной командой
📊 Панель мониторинга — 6 настроенных графиков для типовых задач аналитика
📝 Шпаргалка с запросами — 20 готовых формул для получения метрик
🔔 Набор правил уведомлений — готовые шаблоны для адаптации
📱 Настроенные оповещения — интеграция с Telegram
■ Формат
4 часа, ~80% практики. Минимум теории, максимум полезных навыков.
Пошаговые инструкции: запустили → увидели данные → построили график → настроили уведомление → проверили на практике.
■ Чем эта лабораторная отличается
🎯 Фокус на задачах аналитика — не про администрирование, а про работу с требованиями
🔄 Готовые решения — всё уже настроено, остается только изучить и адаптировать
💼 Бизнес-контекст — каждая метрика объясняется через пользовательские сценарии
⚡️ Быстрый результат — за 4 часа получите работающую систему мониторинга
■ Результат для бизнеса
Конкретика вместо общих слов:
Вместо «API тормозит» → «Время ответа выросло с 200 до 800 миллисекунд после обновления»
Вместо «иногда не работает» → «За неделю 0.15% запросов завершились ошибкой»
Вместо «не справится с нагрузкой» → «Сейчас 400 запросов в секунду, пик 900 — есть двойной запас»
Общий язык с командой — споры заменяются графиками, предположения — данными.
Проактивность — узнаете о проблемах раньше пользователей.
■ Итог
После лабораторной у вас будет:
Работающая система мониторинга
Понимание, как формулировать измеримые требования
Навык анализа метрик для приемки релизов
Настроенная система уведомлений
Готовый стенд для экспериментов в своих проектах
Это практические инструменты, которые вы сможете применить уже на следующий день.