[Лаба] Prometheus + Grafana для системного аналитика: метрики и наблюдаемость

4000,00
р.
За 4 часа вы научитесь

  • превращать общие требования в конкретные цифры— от «система должна работать быстро» к «ответ за 300 миллисекунд при 500 запросах в секунду»
  • понимать реальное состояние системы -сколько запросов обрабатывается, какой процент ошибок, как быстро отвечает API
  • создавать панели мониторинга для документирования— визуальные требования, которые понятны и команде, и заказчику
  • настраивать автоматические уведомления— система сама сообщит о проблемах до жалоб пользователей
  • формулировать реалистичные целевые показатели— на основе реальных данных, а не пожеланий заказчика
  • анализировать инциденты по графикам— быстро находить причину проблем по метрикам


Зачем участникам эта лабораторная

Как системный аналитик, вы часто слышите: «система тормозит», «иногда не работает», «не справляется с нагрузкой». Но что это значит в цифрах? Как проверить, что после релиза стало лучше, а не хуже?

В этой лабораторной вы научитесь работать с конкретными метриками системы, создавать понятные графики для контроля требований и настраивать уведомления о проблемах. Это практический навык, который сразу применим в работе.



Что такое Prometheus и Grafana (вкратце)

Prometheus — система, которая собирает и хранит метрики (цифровые показатели работы системы).

Grafana — инструмент для создания графиков и панелей мониторинга из этих метрик.

Вместе они дают полную картину: сбор данных → хранение → красивые графики → уведомления о проблемах.



Для кого

Системные и бизнес-аналитики, архитекторы решений, владельцы продукта — все, кто:
  •  Пишет нефункциональные требования
  • Участвует в приемке релизов
  • Объясняет заказчику состояние системы
  • Анализирует инциденты

Не нужно: быть программистом или администратором.
Нужно: понимать, что такое API и HTTP-запросы, иметь опыт работы с требованиями.


Что вы сделаете за 4 часа

Блок 1: Запуск и знакомство (30 мин)
Запустите готовый стенд с тестовым API интернет-магазина. Разберете, какие бизнес-требования превращаются в какие метрики (например, «быстрая работа» → время ответа).
Блок 2: Основы метрик (45 мин)
Изучите 3 основных типа показателей: счетчики, текущие значения, распределения. Напишете первые запросы для получения данных: количество запросов в секунду, процент ошибок, время ответа. Найдете самый медленный метод API.
Блок 3: Создание панели мониторинга (60 мин)
Соберете панель «Взгляд аналитика» с 6 графиками:
— Количество запросов в секунду
— Процент ошибок
— Время ответа (95-й процентиль)
— Топ-5 самых используемых методов
— Количество созданных заказов
— Время работы системы
Блок 4: Целевые показатели системы (30 мин)
Разберете, что такое SLA/SLO в понятных терминах. На основе текущих данных сформулируете реалистичные целевые показатели с запасом на деградацию.
Блок 5: Продвинутые возможности (45 мин)
Добавите фильтры для анализа отдельных методов, отметки релизов на графиках, сравнение показателей разных версий. Организуете панели по папкам.
Блок 6: Настройка уведомлений (45 мин)
Настроите правила оповещений: система медленно отвечает, много ошибок, сервис недоступен. Подключите отправку в Telegram. Проверите, что уведомления приходят.
Блок 7: Работа с инцидентами (30 мин)
Симулируете 3 типичные проблемы: замедление API, рост ошибок, падение сервиса. Отработаете анализ: получение уведомления → изучение графиков → поиск причины.
Блок 8: Подготовка к реальной работе (15 мин)
Обсудите, как внедрить это в своих проектах: где хранить данные, как разграничить доступ, как интегрировать с другими системами.


Компетенции, которые вы прокачаете

  • Формулирование измеримых требований — переводить «быстро и надежно» в конкретные цифры
  • Чтение метрик — понимать, что показывают разные типы графиков
  • Создание информативных панелей — визуализировать требования и их выполнение
  • Работа с целевыми показателями — устанавливать реалистичные SLA на основе данных
  • Настройка мониторинга — получать уведомления о проблемах вовремя
  • Анализ инцидентов — быстро находить причины проблем по графикам


Что получите «на руки»

📦 Готовый стенд — все компоненты в Docker, запускается одной командой

📊 Панель мониторинга — 6 настроенных графиков для типовых задач аналитика

📝 Шпаргалка с запросами — 20 готовых формул для получения метрик

🔔 Набор правил уведомлений — готовые шаблоны для адаптации

📱 Настроенные оповещения — интеграция с Telegram


Формат

4 часа, ~80% практики. Минимум теории, максимум полезных навыков.

Пошаговые инструкции: запустили → увидели данные → построили график → настроили уведомление → проверили на практике.


Чем эта лабораторная отличается

🎯 Фокус на задачах аналитика — не про администрирование, а про работу с требованиями

🔄 Готовые решения — всё уже настроено, остается только изучить и адаптировать

💼 Бизнес-контекст — каждая метрика объясняется через пользовательские сценарии

⚡️ Быстрый результат — за 4 часа получите работающую систему мониторинга


Результат для бизнеса

Конкретика вместо общих слов:
  •  Вместо «API тормозит» → «Время ответа выросло с 200 до 800 миллисекунд после обновления»
  •  Вместо «иногда не работает» → «За неделю 0.15% запросов завершились ошибкой»
  •  Вместо «не справится с нагрузкой» → «Сейчас 400 запросов в секунду, пик 900 — есть двойной запас»

Общий язык с командой — споры заменяются графиками, предположения — данными.

Проактивность — узнаете о проблемах раньше пользователей.


Итог

После лабораторной у вас будет:
  •  Работающая система мониторинга
  •  Понимание, как формулировать измеримые требования
  •  Навык анализа метрик для приемки релизов
  •  Настроенная система уведомлений
  •  Готовый стенд для экспериментов в своих проектах

Это практические инструменты, которые вы сможете применить уже на следующий день.

Cтраница экспертов