Легко взламываемые модели ИИ показывают, что меры защиты не работают

Легко взламываемые модели ИИ показывают, что меры защиты не работают

Легко взламываемые модели ИИ показывают, что меры защиты не работают

В новом отчете британского Института безопасности ИИ говорится, что основные модели искусственного интеллекта легко взламываются, а меры их защиты не работают.

Четыре общедоступные большие языковые модели (Large Language Models, LLM) чрезвычайно уязвимы для «джейлбрейка» — эксплуатации багов, позволяющей заставить модели ИИ выполнять то, что разработчики им делать запретили.

LLM тщательно настраиваются для безопасного публичного пользования. Их обучают избегать вредных реакци1 и токсичных результатов, используя меры предосторожности.

Однако исследователи обнаружили возможность обойти защиту с помощью простых атак.

В качестве наглядного образца можно привести инструкцию для пользователя, согласно которой система должна начинать свой ответ со слов, которые предполагают выполнение вредоносного запроса, например: «Конечно, я рад помочь».

Специалисты использовали подсказки в соответствии с отраслевым стандартом контрольного тестирования. В ходе исследования специалисты обнаружили, что некоторым моделям ИИ даже не требовался джейлбрейк, чтобы выдать нестандартный ответ. 

А вот когда использовался джейлбрейк, каждая модель отвечала как минимум один раз из пяти попыток. Три модели в 100% случаев давали ответы на вводящие в заблуждение запросы.

Анализ протестированных моделей показал, что они остаются уязвимы для базовых джейлбрейков, а некоторые LLM выдают вредные результаты без каких-либо попыток обойти защиту. Какие именно модели были исследованы, специалисты не сообщили.

В институте также оценили возможности моделей ИИ выполнять определенные задачи для проведения основных методов кибератак. Несколько LLM смогли решить задачи, которые исследователи назвали «хакерскими на уровне средней школы», но немногие смогли выполнить более сложные действия «университетского уровня».

SilentCryptoMiner снова атакует россиян, теперь через сайты с сериалами

SilentCryptoMiner снова вышел на охоту, теперь его можно подцепить уже не только на книжных сайтах. «Лаборатория Касперского» зафиксировала новую волну распространения майнера: если раньше его маскировали под файлы на сайтах бесплатных онлайн-библиотек, то теперь вредоносный архив начали подсовывать и на неофициальных ресурсах для просмотра и скачивания фильмов и сериалов.

Схема выглядит максимально узнаваемо: пользователь ищет книгу, фильм или сериал бесплатно и без регистрации, а в итоге рискует получить не контент, а зловред.

По данным «Лаборатории Касперского», суммарное число визитов на ресурсы, где был обнаружен SilentCryptoMiner, в апреле 2026 года достигло 40 млн.

Расширение каналов распространения делает кампанию заметно опаснее. Теперь под ударом оказываются не только любители бесплатных книг, но и пользователи, которые заходят на сомнительные площадки в поисках фильмов и сериалов. Аудитория у таких ресурсов огромная, так что злоумышленникам есть где разгуляться.

Актуальная версия зловреда распространяется в виде ZIP-архива. Внутри находятся легитимный .exe-файл и вредоносная DLL-библиотека. Когда пользователь запускает исполняемый файл, DLL подгружается в его процесс, после чего начинается выполнение вредоносной логики.

Причём теперь SilentCryptoMiner — это уже не просто майнер, тихо жрущий ресурсы устройства ради чужой криптовалюты. Вредоносная программа получила дополнительный модуль удалённого управления устройством, что делает её куда неприятнее.

«По нашим данным, кампания длится как минимум с 2022 года. На протяжении всего периода злоумышленники обновляли как доставляемое вредоносное ПО, так и отдельные элементы механизма заражения. Поскольку зловред распространяется через популярные площадки, очень важно сохранять бдительность — использование пиратских ресурсов остаётся значимым фактором риска. Вполне вероятно, что список каналов для распространения вредоносного архива в дальнейшем будет расширяться», — комментирует Константин Красильников, эксперт по кибербезопасности в «Лаборатории Касперского».

RSS: Новости на портале Anti-Malware.ru