Яндекс опубликовал подробный разбор масштабного сбоя 29 ноября

Яндекс опубликовал подробный разбор масштабного сбоя 29 ноября

Яндекс опубликовал подробный разбор масштабного сбоя 29 ноября

Сбой 29 ноября был вызван нарушением сетевой связности из-за технических неполадок в работе инфраструктуры «Яндекс Облака». Компания выложила подробный разбор и разъяснила причины.

Массовый сбой в работе целого ряда сервисов произошел вечером 29 ноября. Он затронул работу банков, служб доставки, операторов связи, соцсетей, маркетплейсов, интернет-компаний.

Инциденте также отразился на работе системы бронирования авиабилетов «Леонардо».

Уже вечером 29 ноября пресс-служба Яндекса признала в ответ на запрос «Ведомостей», что в одной из зон доступности Yandex Cloud возникли проблемы с сетевой связностью.

«29 ноября один из контроллеров сети отказал, и совокупность вышеуказанных факторов привела к тому, что сетевые контроллеры в пике могли осуществлять распространение нескольких миллионов обновлений маршрутов в секунду, при этом работая медленнее, но штатно, всё ещё сохраняя функциональность связанного сервиса, — такие подробности привели технические специалисты Yandex Cloud. — При этом пограничные маршрутизаторы (узлы, отвечающие за внешнюю связность) не были готовы к такому потоку обновления маршрутной информации и не успевали декодировать обновления. Это приводило к росту очереди обновлений одновременно на всех инстансах разных группировок внешней связности и связному росту потребления памяти. Рост нагрузки на пограничные маршрутизаторы привел к их частичному отказу».

Для устранения инцидента технические специалисты локализовали контроллер, который вызвал отказ, и восстановили его работоспособность. Помимо этого, они увеличили объем памяти и доработали механизм защиты от исчерпания памяти для группировок пограничных маршрутизаторов, отвечающих за внешнюю связность.

Затем сотрудники технической службы воспроизвели инцидент в лабораторном контуре для проверки эффективности сделанных изменений и приняли меры к тому, чтобы циклическое обновление невалидных маршрутов не повторялось, причем при разных сценариях. Полностью работы по устранению сбоя были завершены 1 декабря.

StormWall дал клиентам полный контроль над защитой L3–L5 в Личном кабинете

Компания StormWall представила одно из самых серьёзных обновлений за последние годы — новый раздел «Митигации» в Личном кабинете. Он меняет привычный подход к управлению защитой на уровнях L3–L5 и позволяет клиентам самостоятельно настраивать фильтрацию трафика без обращения в техподдержку.

Главная идея обновления — дать пользователям больше контроля. Теперь инфраструктуру можно сегментировать, объединять серверы и подсети в отдельные группы и применять к ним собственные правила защиты. Всё настраивается буквально в пару кликов — через Личный кабинет или API.

Новый раздел доступен во всех тарифах продуктов StormWall для сетей и StormWall для сервисов. Он включает в себя группы серверов и подсетей, для которых можно задавать индивидуальные параметры фильтрации.

 

Пользователям доступны два типа митигаций:

  • Default Mitigation — базовый набор правил, который автоматически создаётся и охватывает все подключённые префиксы;
  • Пользовательские митигации — позволяют формировать собственные группы ресурсов, настраивать независимые белые и чёрные списки и задавать отдельные правила защиты.

С новой функциональностью правила фильтрации стали заметно детальнее. Можно:

  • задавать приоритет и действие для трафика — пропускать (Pass), блокировать (Drop) или обходить дальнейшие проверки (Bypass);
  • включать геофильтрацию и управлять трафиком по странам;
  • описывать правила по IP-адресам, протоколам и портам.

StormWall приводит несколько типовых сценариев, где «Митигации» упрощают жизнь.

1. Блокировка UDP-трафика для конкретного адреса.

Если у оборудования есть неиспользуемые UDP-порты, которые могут стать целью атак, достаточно создать правило Drop для UDP на нужном IP. Всё блокируется на уровне сети StormWall — быстро и без доступа к самому устройству.

2. Разрешение только нужных TCP-портов.

Для серверов с веб-сервисами можно оставить открытыми только порты 80 и 443, а весь остальной TCP-трафик автоматически отсеять. Это снижает поверхность атак и повышает общую безопасность.

Дополнительно в правилах можно использовать TCP Flag Mask, чтобы отсекать подозрительные пакеты, например те, что применяются для скрытого сканирования портов.

В следующих релизах компания планирует расширять функциональность: добавить новые критерии для правил фильтрации и внедрить ИИ-детектор, который поможет ещё точнее выявлять нежелательный трафик. В результате Личный кабинет StormWall постепенно превращается в полноценный центр управления защитой L3–L5 для корпоративной инфраструктуры.

RSS: Новости на портале Anti-Malware.ru