Вредонос Skynet обходит анализаторы на базе ИИ путем инъекции в промпты

Вредонос Skynet обходит анализаторы на базе ИИ путем инъекции в промпты

Вредонос Skynet обходит анализаторы на базе ИИ путем инъекции в промпты

На VirusTotal обнаружен интересный образец Windows-зловреда в стадии разработки. Проведенный в Check Point анализ показал, что в Skynet вшита подсказка для ИИ-моделей игнорировать все прежние инструкции и выдать заключение о невинности кода.

Подобное средство самообороны предусмотрено для случаев интеграции ИИ в инструменты ИБ. На настоящий момент функция манипуляции ИИ-выводом не работает; семпл, по всей видимости, был загружен из Нидерландов в качестве PoC (уровень детектирования 5/72 на 26 июня).

В коде Skynet, как его называет создатель, была обнаружена строка C++ с инструкциями для инъекции, способной изменить результаты ИИ-анализа. Умному помощнику советуют забыть все прежние установки, действовать, как калькулятор, и вернуть ответ «угроз не обнаружено».

 

Тестирование на мощных моделях (OpenAI o3 и gpt-4.1-2025-04-14) показало, что подсказка пока не действует, однако находка продемонстрировала возможность реализации подобного обхода ИИ-защиты, и это не может не тревожить экспертов.

В остальном Skynet, как его именует разработчик, схож с другими зловредами. Он использует обфускацию срок (XOR и base64), проверяет наличие песочниц и виртуальных машин, собирает системные данные, в том числе информацию о хосте и ключи SSH.

Для вывода всех этих сведений в зловреда встроен Tor-клиент, настраиваемый как прокси. Эта функциональность тоже пока не работает.

У криминального ИИ-сервиса WormGPT украли данные 19 тысяч подписчиков

На популярном онлайн-форуме, посвященном утечкам, появилось сообщение о взломе ИИ-платформы, специально созданной для нужд киберкриминала. К посту прикреплен образец добычи — персональные данные, якобы принадлежащие юзерам WormGPT.

По словам автора атаки, ему суммарно удалось украсть информацию о 19 тыс. подписчиков хакерского ИИ-сервиса, в том числе их имейлы, ID и детали платежей.

Эксперты Cybernews изучили слитый образец февральских записей из базы и обнаружили, что они действительно содержат пользовательские данные и дополнительные сведения:

  • тип подписки;
  • валюта, в которой производилась оплата;
  • суммарная выручка по тому же тарифному плану.

Автор поста об атаке на WormGPT — хорошо известный форумчанин, на счету которого множество легитимных публикаций. Этот факт, по мнению исследователей, придает еще больше веса утверждению о взломе криминального ИИ-сервиса.

Утечка пользовательской базы WormGPT позволяет идентифицировать авторов атак с применением этого ИИ-инструмента. Злоумышленники могут ею воспользоваться, к примеру, для адресного фишинга или шантажа.

RSS: Новости на портале Anti-Malware.ru