
До 40% инцидентов в ИТ-инфраструктуре остаются незамеченными или выявляются с задержкой. Проблема не в отсутствии инструментов, а в фрагментарном мониторинге, избыточных алертах и отсутствии бизнес-контекста.
В условиях гибридных сред, микросервисной архитектуры и мультиоблачных платформ традиционные методы мониторинга теряют свою эффективность. Они фиксируют симптомы, но не объясняют причины и не помогают принимать решения. В результате страдает SLA, команды перегружены, а инвестиции в инструменты не приводят к повышению надежности сервисов.
В эфире AM Live мы обсудим, как создать работающий мониторинг в ИТ, который действительно работает на бизнес. От базовых принципов observability до внедрения SRE-подходов и управления надежностью через SLI/SLO. Разберем какие метрики использовать для мониторинга состояния сервисов, как строить платформу мониторинга и как интегрировать ее с ITSM, CI/CD и SecOps. Цель — превратить мониторинг из простого наблюдения в инструмент управления.
Ключевые вопросы дискуссии:
- Как работает мониторинг в современной ИТ-инфраструкты
- Что сегодня вообще входит в понятие мониторинга ИТ-инфраструктуры?
- Почему классический мониторинг в ИТ уже не покрывает потребности современной инфраструктуры?
- Как мониторинг ИТ-инфраструктуры помогает управлять производительностью, здоровьем и безопасностью систем?
- Как обосновать для бизеса необходимость инвестировать в мониторинга ИТ-инфраструктуры?
- Когда эффективнее использовать централизованный мониторинг, а когда децентрализованный?
- Из каких технических компонентов состоит мониторинг ИТ-инфраструктуры?
- Как собирать данные о производительности и состоянии систем?
- Как выявлять аномалии и предсказывать потенциальные сбои?
- Как правильно определить зону покрытия для мониторинга?
- Как правильно внедрить культуру observability и обучить команду?
- Как искусственный интеллект помогает предсказывать сбои и выявлять аномалии в работе ИТ-инфраструктуры?
- Практика внедрения мониторинга ИТ-инфраструкты
- Как мониторинг связан с надежностью систем и сервисов в ИТ?
- Что дают бизнесу такие подходы, как SLI, SLO и error budget?
- Какие метрики реально отражают состояние сервисов, а какие создают иллюзию контроля?
- Как SRE-подходы помогают масштабировать процессы управления инцидентами и выравнивать их с бизнес-KPI?
- Что такое хаос-инжиниринг и в какоих случаях он эффективен для выявления слабых мест системы?
- Как правильно выбирать инструменты мониторинга под инфраструктуру и задачи компании?
- Какие инструменты позволяют собирать метрики, логи и трассировки в единую платформу?
- Как правильно хранить и использовать все логи, алерты и метрики для аналитики и прогнозирования?
- Какие задачи решают современные платформы мониторинга?
- Что важнее при выборе платформы: глубина данных, удобство эксплуатации или экономическая эффективность?
- Что дает интеграция мониторинга с CI/CD, ITSM, SIEM и инструментами SecOps?
- Итоги и прогнозы
- Какие подходы к мониторингу и observability станут базовыми для компаний в 2026–2027 году?
- Как будут меняться роль автоматизации, AIOps и машинного обучения в мониторинге и наблюдаемости ИТ-инфраструктуры?
- Какие шаги нужно предпринять компании, чтобы перейти от разрозненного мониторинга к зрелой и полезной для бизнеса модели наблюдаемости?
Приглашенные эксперты:
|
|
Уточняется Уточняется |
Модераторы:
|
|
Руслан Иванов Директор департамента продуктового развития гибридных и частных облаков, Cloud.ru |





