Легко взламываемые модели ИИ показывают, что меры защиты не работают

Легко взламываемые модели ИИ показывают, что меры защиты не работают

Легко взламываемые модели ИИ показывают, что меры защиты не работают

В новом отчете британского Института безопасности ИИ говорится, что основные модели искусственного интеллекта легко взламываются, а меры их защиты не работают.

Четыре общедоступные большие языковые модели (Large Language Models, LLM) чрезвычайно уязвимы для «джейлбрейка» — эксплуатации багов, позволяющей заставить модели ИИ выполнять то, что разработчики им делать запретили.

LLM тщательно настраиваются для безопасного публичного пользования. Их обучают избегать вредных реакци1 и токсичных результатов, используя меры предосторожности.

Однако исследователи обнаружили возможность обойти защиту с помощью простых атак.

В качестве наглядного образца можно привести инструкцию для пользователя, согласно которой система должна начинать свой ответ со слов, которые предполагают выполнение вредоносного запроса, например: «Конечно, я рад помочь».

Специалисты использовали подсказки в соответствии с отраслевым стандартом контрольного тестирования. В ходе исследования специалисты обнаружили, что некоторым моделям ИИ даже не требовался джейлбрейк, чтобы выдать нестандартный ответ. 

А вот когда использовался джейлбрейк, каждая модель отвечала как минимум один раз из пяти попыток. Три модели в 100% случаев давали ответы на вводящие в заблуждение запросы.

Анализ протестированных моделей показал, что они остаются уязвимы для базовых джейлбрейков, а некоторые LLM выдают вредные результаты без каких-либо попыток обойти защиту. Какие именно модели были исследованы, специалисты не сообщили.

В институте также оценили возможности моделей ИИ выполнять определенные задачи для проведения основных методов кибератак. Несколько LLM смогли решить задачи, которые исследователи назвали «хакерскими на уровне средней школы», но немногие смогли выполнить более сложные действия «университетского уровня».

Российский телеком накрыли DDoS-атаки до 2,7 Тбит/с длиной в неделю

Киберпреступники сменили тактику атак на российский телеком. Если раньше операторы связи чаще сталкивались с короткими DDoS-ударами, то теперь злоумышленники делают ставку на длительное изматывание инфраструктуры. К такому выводу пришли аналитики StormWall, изучив данные клиентов компании за май и июнь 2026 года.

По данным исследования, телеком-компании всё чаще подвергаются сверхмощным DDoS-атакам объемом от 1,3 до 2,7 Тбит/с.

Но главная особенность новых кампаний — их продолжительность. Атаки могут растягиваться на недели.

При этом речь не идет о непрерывном потоке трафика. Обычно злоумышленники атакуют по несколько часов в день, выбирая периоды максимальной нагрузки. Такой подход позволяет не только создавать перебои в работе сервисов, но и увеличивать расходы операторов на обслуживание трафика.

Эксперты отмечают, что многие провайдеры рассчитывают стоимость потребления трафика по так называемому 95-му перцентилю. В результате длительная DDoS-кампания способна нанести финансовый ущерб даже тем компаниям, которые технически способны выдержать атаку.

Статистика показывает серьезное изменение картины угроз. Если в мае 2025 года на атаки мощностью менее 50 Гбит/с приходилось 66% всех инцидентов, то в мае 2026 года их доля сократилась до 16,5%.

Иными словами, эпоха мелких DDoS-атак для телеком-отрасли практически закончилась. На смену ей пришли хорошо подготовленные противники с доступом к терабитным мощностям.

Последствия таких атак могут выходить далеко за пределы одного оператора. Сбои способны затронуть интернет-доступ, телефонию, облачные сервисы и корпоративные приложения. Кроме того, проблемы в сетях операторов автоматически отражаются на клиентах — от банков и ретейла до интернет-провайдеров и других организаций, зависящих от каналов связи.

В StormWall отмечают, что злоумышленники всё чаще стремятся не просто создать кратковременный сбой, а нанести максимально возможный ущерб инфраструктуре и бизнесу жертвы.

RSS: Новости на портале Anti-Malware.ru