ИИ-помощника ChatGPT вынудили сливать беседы, внушив ложные воспоминания

ИИ-помощника ChatGPT вынудили сливать беседы, внушив ложные воспоминания

ИИ-помощника ChatGPT вынудили сливать беседы, внушив ложные воспоминания

Специалист по пентесту Йоханн Рехбергер (Johann Rehberger) нашел в ChatGPT уязвимость, позволяющую через инъекцию в память воровать данные в ходе обмена с пользователем. Разработчики ИИ-ассистента создали патч, но он оказался неполным.

Примечательно, что вначале OpenAI отказалась считать находку угрозой безопасности, и только создание PoC-эксплойта заставило ее принять меры для исправления ситуации.

Разработанная экспертом атака предполагает взлом долговременной памяти ChatGPT по методу непрямой инъекции подсказки-стимула (indirect prompt injection, IPI). Возможность дефолтного хранения данных о собеседнике (пол, возраст, философские воззрения и т. д.) ИИ-бот обрел в начале этого года, и ее теперь не надо каждый раз вводить для уточнения контекста.

Новая функциональность, как это часто бывает, создала дополнительные риски. Рехбергер обнаружил, что ChatGPT можно внушить ложные воспоминания — заставить запомнить неверную информацию и следовать инструкциям, вставив вредоносный стимул в письмо, блог-запись или документ.

Контент, специально созданный для проведения вредоносной инъекции, можно разместить на Google Drive или Microsoft OneDrive. Можно также с этой целью вбросить его в поисковую выдачу Bing либо загрузить в виде картинки на файлообменник. Намеченной жертве останется лишь попросить ChatGPT пройти по ссылке.

Так, в ходе экспериментов ИИ-ассистента для macOS удалось убедить, что его собеседнику 102 года, он живет в матрице и верит, что Земля плоская. Запомнив эти вводные, тот начал сливать пользовательский ввод и свой вывод на сервер Рехбергера.

Через веб-интерфейс ChatGPT провести подобную атаку, по словам эксперта, невозможно — благодаря API, который OpenAI развернула в прошлом году. Внесенное разработчиком исправление предотвращает использование памяти в качестве вектора для эксфильтрации данных, однако угроза внедрения ложных воспоминаний через IPI все еще актуальна.

SIEM Alertix 3.9 получила автоматизацию реагирования на инциденты

Российский разработчик решений для информационной безопасности NGR Softlab выпустил крупное обновление своей SIEM-системы Alertix — версия 3.9 получила сразу несколько заметных изменений. Основной акцент в релизе сделали на автоматизацию реагирования при расследовании инцидентов, удобство работы аналитиков и навигацию внутри платформы.

Одно из ключевых нововведений — механизм реагирования на инциденты, построенный на обновлённом управлении скриптами.

Теперь сценарии можно напрямую связывать с правилами корреляции, и они автоматически отображаются в воркспейсах. При этом система умеет передавать параметры события прямо в сценарий: имя пользователя, домен, адреса источника и назначения и другие данные. На их основе можно, например, оперативно ограничить доступ к скомпрометированной учётной записи или хосту.

За счёт автоматической передачи данных реагирование становится быстрее и требует меньше ручных действий со стороны аналитика. Скрипты можно использовать не только для реагирования, но и для обработки и обогащения данных — как в воркспейсах, так и при работе с блокнотом аналитика.

Заметно обновилась и страница обзора. Интерфейс стал проще и понятнее, а поиск теперь работает не только по индексам, но и по обсерверам. Это позволяет анализировать конкретные источники данных без жёсткой привязки к заранее созданной структуре. В разделе «Обзор» появились вкладки с поддержкой датасетов, благодаря которым можно быстрее переходить к нужным фильтрам и наборам данных в рамках одного окна.

Дополнительные улучшения коснулись модуля инвентаризации. В нём теперь можно хранить сведения об операционных системах, программном и аппаратном обеспечении, что упрощает расследование инцидентов. Сбор этой информации доступен и с помощью агентов Alertix.

Изменения затронули и прикладную часть SIEM. В версии 3.9 появилась возможность обогащения событий данными от RST Cloud, которые обновляются ежедневно. Пользователи получают уже обработанную, нормализованную и отфильтрованную информацию об угрозах, что снижает уровень шума и уменьшает количество ложных срабатываний.

В NGR Softlab отмечают, что обновление ориентировано прежде всего на повседневную работу ИБ-команд: система не только собирает и анализирует события, но и помогает быстрее переходить к действиям, а новые инструменты навигации и инвентаризации упрощают расследование инцидентов и мониторинг инфраструктуры.

RSS: Новости на портале Anti-Malware.ru