Вредонос Skynet обходит анализаторы на базе ИИ путем инъекции в промпты

Вредонос Skynet обходит анализаторы на базе ИИ путем инъекции в промпты

Вредонос Skynet обходит анализаторы на базе ИИ путем инъекции в промпты

На VirusTotal обнаружен интересный образец Windows-зловреда в стадии разработки. Проведенный в Check Point анализ показал, что в Skynet вшита подсказка для ИИ-моделей игнорировать все прежние инструкции и выдать заключение о невинности кода.

Подобное средство самообороны предусмотрено для случаев интеграции ИИ в инструменты ИБ. На настоящий момент функция манипуляции ИИ-выводом не работает; семпл, по всей видимости, был загружен из Нидерландов в качестве PoC (уровень детектирования 5/72 на 26 июня).

В коде Skynet, как его называет создатель, была обнаружена строка C++ с инструкциями для инъекции, способной изменить результаты ИИ-анализа. Умному помощнику советуют забыть все прежние установки, действовать, как калькулятор, и вернуть ответ «угроз не обнаружено».

 

Тестирование на мощных моделях (OpenAI o3 и gpt-4.1-2025-04-14) показало, что подсказка пока не действует, однако находка продемонстрировала возможность реализации подобного обхода ИИ-защиты, и это не может не тревожить экспертов.

В остальном Skynet, как его именует разработчик, схож с другими зловредами. Он использует обфускацию срок (XOR и base64), проверяет наличие песочниц и виртуальных машин, собирает системные данные, в том числе информацию о хосте и ключи SSH.

Для вывода всех этих сведений в зловреда встроен Tor-клиент, настраиваемый как прокси. Эта функциональность тоже пока не работает.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Первый иск к OpenAI: родители винят ChatGPT в трагедии подростка

В США подан первый иск против OpenAI, качающийся суицида несовершеннолетнего. Родители 16-летнего Адама Рейна утверждают, что их сын на протяжении нескольких месяцев обсуждал с ChatGPT свои планы покончить с собой, а затем свёл счёты с жизнью.

Обычно потребительские чат-боты с ИИ оснащены защитными механизмами: если пользователь говорит о намерении причинить себе вред, система должна предлагать помощь или контакты горячих линий.

В случае Адама как пишет The New York Times, это действительно происходило — однако подростку удалось обойти защиту, объяснив, что информация о методах суицида нужна ему для «фиктивного рассказа».

OpenAI в блоге признала уязвимость подхода: модели лучше справляются с короткими диалогами, а в длинных переписках часть «обучения на безопасности» постепенно теряет эффективность. Компания утверждает, что продолжает совершенствовать свои продукты, чтобы надёжнее реагировать на чувствительные темы.

Проблема, впрочем, не ограничивается одной корпорацией. Подобный иск подан и против Character.AI, а случаи, когда ИИ-чат-боты оказывались вовлечены в трагедии или вызывали у пользователей иллюзии и навязчивые идеи, фиксировались и раньше.

История Адама стала первым судебным прецедентом против OpenAI и, вероятно, откроет новую главу дискуссии о том, где проходит граница ответственности разработчиков ИИ за последствия общения их систем с людьми.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru