Авария в ЦОД Яндекса вызвала массовый сбой. AM он тоже затронул

Авария в ЦОД Яндекса вызвала массовый сбой. AM он тоже затронул

Авария в ЦОД Яндекса вызвала массовый сбой. AM он тоже затронул

Из-за аварии в одном из центров обработки данных (ЦОД) компании «Яндекс» стали недоступны как собственные сервисы компании, так и ресурсы её клиентов, пользующихся услугами «Яндекс Облака». Среди пострадавших оказались службы доставки, федеральные розничные сети, стриминговые платформы и онлайн-кинотеатры.

Первым о неполадках сообщил сервис «Яндекс.Музыка». По информации портала «Сбой.рф», массовые жалобы пользователей начали поступать с 12:00 по московскому времени, причем большинство обращений было из московского региона.

«У части пользователей наблюдались временные сложности с доступом к некоторым сервисам Яндекса», — заявили в пресс-службе «Яндекс.Музыки» агентству «РИА Новости». К 14:40 сервис сообщил о восстановлении своей работы.

«30 марта с 12:45 до 14:20 Центр мониторинга и управления сетью связи общего пользования фиксировал резкий рост обращений пользователей о проблемах в работе сервисов, использующих ресурсы "Яндекс Облака". Причиной стал сбой в электроснабжении одного из ЦОД компании "Яндекс"», — сообщил Центр мониторинга и управления сетями связи общего пользования (ЦМУ ССОП), подведомственный Роскомнадзору.

Как сообщает «Газета.Ru», помимо сервисов «Яндекса», неполадки также затронули онлайн-площадки таких компаний, как «М.Видео», «Вкусно — и точка», Delivery Club, KFC, «Кинопоиск» и «Аптека.ру». Сбой также отразился на работе ряда мобильных операторов. По информации РБК, проблемы возникли у пользователей мобильных приложений «Купер», «Магнит» и ЦИАН. Наш собственный сайт также оказался недоступен.

Компания «Яндекс» начала официально фиксировать инцидент с 12:25. Примерно через 40 минут появилось сообщение об аварии: «В настоящий момент зона ru-central1-b полностью обесточена. Команда выясняет причины и работает над устранением последствий. Рекомендуем клиентам временно перенести нагрузку в другие зоны».

В 15:30 «Яндекс» сообщил о начале восстановления электроснабжения. К 17:04 было объявлено о полном восстановлении подачи электроэнергии и запуске оборудования, а ещё через час компания подтвердила возобновление работы базовой инфраструктуры.

Ранее, 29 ноября 2024 года, «Яндекс» уже сталкивался с масштабным сбоем, вызванным отказом коммутатора ядра сети.

Популярную ИИ-библиотеку LiteLLM заразили бэкдором через PyPI

В экосистеме ИИ-разработки всплыла неприятная история: исследователи из Endor Labs обнаружили, что популярная Python-библиотека LiteLLM, у которой больше 95 млн загрузок в месяц, была скомпрометирована в репозитории PyPI. Через заражённые версии злоумышленники распространяли многоступенчатый бэкдор.

Речь идёт о версиях 1.82.7 и 1.82.8. Причём в официальном GitHub-репозитории проекта такого вредоносного кода не было.

Проблема возникла именно в пакетах, опубликованных в PyPI: туда попал файл с закладкой, который декодировал и запускал скрытую нагрузку сразу после импорта библиотеки.

Во второй заражённой версии, 1.82.8, схема стала ещё жёстче. Пакет устанавливал .pth-файл в директорию site-packages, из-за чего вредоносный код мог запускаться вообще при любом старте Python, даже если сам LiteLLM никто не импортировал.

После запуска зловред начинал искать самое ценное: SSH-ключи, токены AWS, GCP и Azure, секреты Kubernetes, криптокошельки и другие конфиденциальные данные. Если заражение происходило в контейнерной или кластерной среде, вредонос пытался двигаться дальше по инфраструктуре, в том числе через развёртывание привилегированных подов на узлах Kubernetes.

Для закрепления на хосте атакующие, как сообщается, ставили systemd-бэкдор sysmon.service, который регулярно связывался с командным сервером и мог получать новые команды или дополнительные вредоносные модули.

Специалисты считают, что за атакой стоит группировка TeamPCP, которая в последнее время явно разошлась: до этого её уже замечали в инцидентах, затронувших GitHub Actions, Docker Hub, npm и OpenVSX.

Украденные данные, по информации исследователей, шифровались и отправлялись на сервер атакующих. Для маскировки использовались домены, внешне похожие на легитимные, например models.litellm[.]cloud и checkmarx[.]zone.

Сейчас разработчикам и DevOps-командам советуют как можно быстрее проверить окружение. Последней известной чистой версией LiteLLM считается 1.82.6. Если в системе использовались 1.82.7 или 1.82.8, нужно проверить наличие файла litellm_init.pth, артефактов вроде ~/.config/sysmon/sysmon.py и сервиса sysmon.service.

RSS: Новости на портале Anti-Malware.ru