Сбой питания в зоне Yandex Cloud: компания сделала выводы и назвала причины

Сбой питания в зоне Yandex Cloud: компания сделала выводы и назвала причины

Сбой питания в зоне Yandex Cloud: компания сделала выводы и назвала причины

30 марта 2025 года произошёл серьёзный сбой в одном из ключевых дата‑центров Яндекса — сервисы, размещённые в зоне, оказались временно недоступны. Причиной стал двойной отказ линий электропитания после аварии на опорной подстанции, вызвавшей каскадные отказы оборудования.

Ключевые факты:

  • Авария началась в 12:18 по московскому времени. В течение нескольких минут было зафиксировано критическое занижение напряжения.
  • Обе линии 110 кВ, питающие дата‑центр, отключились одновременно — ситуация крайне маловероятная, но всё же произошла.
  • Дизельные генераторы и ДРИБП поддержали критическую инфраструктуру (наблюдение, сеть, управление), но не могли принять полную нагрузку.
  • Полное восстановление сервисов заняло около 10 часов: к полуночи работа дата‑центра была полностью нормализована.

План по предотвращению повторений:

  • В Яндексе заявили о пересмотре рисков энергоснабжения и об усилении архитектуры резервирования.
  • Упор будет сделан не только на технические решения (включая ДГУ), но и на операционные учения и мультизональную устойчивость.
  • Для клиентов Yandex Cloud будет расширяться библиотека архитектур отказоустойчивости, включая инструменты вроде Zonal Shift, уже доказавшего свою эффективность в кризисной ситуации.

Яндекс подчёркивает: мультизональная архитектура — критически важна для надёжности. Опыт 30 марта — это повод для всех инженеров пересмотреть модели резервирования и подготовки к редким, но возможным аварийным сценариям.

Брешь в материнках ASUS, MSI и Gigabyte позволяет атаковать до запуска ОС

Уязвимость в материнских платах сразу нескольких крупных производителей позволяет атаковать компьютер ещё до загрузки операционной системы. О проблеме предупредил центр реагирования CERT/CC при Университете Карнеги — Меллона. Речь идёт об ошибке в реализации UEFI и механизма IOMMU, который должен защищать систему от несанкционированного доступа к памяти со стороны подключённых устройств.

На практике во время ранней стадии загрузки прошивка «сообщает», что защита DMA уже включена, хотя IOMMU на самом деле активируется лишь в самый последний момент — прямо перед передачей управления операционной системе.

Этим может воспользоваться злоумышленник, если у него есть физический доступ к устройству. Подключив специально подготовленное PCIe-устройство, атакующий способен получить доступ к данным в памяти, повлиять на начальное состояние системы или даже внедрить код до старта ОС — ещё до того, как заработают любые защитные механизмы Windows или Linux.

Проблема затрагивает материнские платы ASRock, Asus, Gigabyte и MSI — все четыре вендора уже подтвердили наличие уязвимых моделей и выпустили обновления прошивок. При этом, по данным CERT/CC, решения от AMD, AMI, Insyde, Intel, Phoenix Technologies и Supermicro уязвимости не подвержены. Для более чем десятка других производителей статус пока остаётся «неизвестным».

Хотя сценарий атаки выглядит тревожно, эксперты подчёркивают: без физического доступа к компьютеру эксплуатировать уязвимость невозможно. Тем не менее в средах, где устройства могут оказаться в чужих руках — например, в офисах, лабораториях или дата-центрах, — риск нельзя игнорировать.

CERT/CC рекомендует как можно быстрее установить обновления прошивок и соблюдать базовые меры аппаратной безопасности. Особенно это актуально для виртуализированных и облачных сред, где IOMMU играет ключевую роль в изоляции и доверии между компонентами системы.

Уязвимостям присвоены идентификаторы CVE-2025-11901, CVE-2025-14302, CVE-2025-14303 и CVE-2025-14304. О проблеме сообщили исследователи из Riot Games.

RSS: Новости на портале Anti-Malware.ru