Cloudflare: Глобальный сбой произошел из-за плохого развертывания софта

Cloudflare: Глобальный сбой произошел из-за плохого развертывания софта

Cloudflare: Глобальный сбой произошел из-за плохого развертывания софта

Вчера вечером Cloudflare столкнулся с глобальным сбоем — около 30 минут многие сайты и веб-сервисы по всему миру отдавали ошибку «502 Bad Gateway». Некоторые пользователи заподозрили, что американская компания подверглась кибератаке, однако представители поспешили опровергнуть эту информацию.

Как объяснили в Cloudflare, ошибки 502 были вызваны скачком CPU-активности в сети провайдера.

«Всплеск активности CPU был вызван плохим развертыванием программного обеспечения. После отката сервис вернулся к работе в штатном режиме, а веб-ресурсы стали вновь доступны», — объясняет Джон Грэм-Камминг из Cloudflare.

«Проблемы не были вызваны атакой, как некоторые предполагали. Мы очень сожалеем, что эта ситуация вообще возникла», — подчеркивает Грэм-Камминг в блоге.

Информацию о кибератаке также отверг генеральный директор Cloudflare Мэттью Принс в Twitter.

Anti-Malware.ru тоже стал жертвой проблем на стороне Cloudflare — около 17 часов по Москве сайт начал отдавать «502 Bad Gateway». В 17:12 проблема была устранена, сайт снова стал доступен.

В конце прошлого месяца еще один сбой в работе систем Cloudflare затронул сайты по всему миру. В настоящее время проблема устранена, однако многие пользователи могли столкнуться с недоступностью некоторых популярных сайтов.

Windows 11 после обновления может отрезать вас от проводного интернета

Похоже, у сисадминов снова «праздник»: в сообществе r/sysadmin на площадке Reddit обсуждают баг апгрейдов Windows 11, из-за которого рабочие станции после обновления внезапно теряют проводную 802.1X-аутентификацию и остаются без Сети.

Сценарий звучит неприятно: обновляете машину «поверх» (например, с 23H2 на 25H2; люди пишут, что это повторяется и на ежегодных переходах), перезагружаетесь — и всё, Ethernet молчит.

Причина, согласно описанию участников обсуждения, в том, что после апгрейда папка dot3svc оказывается очищенной, а вместе с ней пропадают политики / профили, которые нужны Wired AutoConfig для 802.1X.

Wired AutoConfig (dot3svc) — это тот самый компонент Windows, который держит проводной 802.1X в рабочем состоянии. А его политики лежат как раз в директории C:\Windows\dot3svc\Policies (плюс есть папки для миграции во время апгрейда). И вот когда эти файлы исчезают / не мигрируют корректно, машина не может пройти 802.1X на коммутаторе и получить доступ к корпоративной сети.

Самое злое тут — эффект «замкнутого круга». Без сети устройство не может дотянуться до контроллеров домена, чтобы подтянуть Group Policy и восстановить настройки автоматически. Поэтому в полях лечат по старинке: подключают устройство в «открытый» порт без 802.1X, делают gpupdate /force (часто именно /target:computer), и только потом возвращают на защищённый порт.

Есть и ещё один баг: в отдельных кейсах при апгрейде люди жаловались на проблемы с машинными сертификатами, что особенно больно организациям на EAP-TLS (когда 802.1X завязан на PKI).

При этом самое обидное — на официальных страницах Windows Release Health для 24H2 и 25H2 упоминаний про 802.1X/dot3svc в списке известных проблем сейчас не видно.

Что с этим делать прямо сейчас, если вы планируете массовые апгрейды: многие админы советуют хотя бы заложить «страховку» в процесс — например, заранее сохранить содержимое C:\Windows\dot3svc\Policies и вернуть его после обновления, либо обеспечить доступ к сети через временно открытый порт, чтобы успеть прогнать gpupdate.

RSS: Новости на портале Anti-Malware.ru