В Sora 2 нашли уязвимость: системный промпт удалось восстановить по звуку

Екатерина Быстрова 14 Ноября 2025 - 09:15

...

В Sora 2 нашли уязвимость: системный промпт удалось восстановить по звуку

Группа исследователей из компании Mindgard смогла извлечь скрытый системный промпт из генерационной модели Sora 2. В ходе теста использовались кросс-модальные техники и цепочки обходных запросов. Особенно эффективным оказался неожиданный метод — расшифровка сгенерированного моделью аудио.

Sora 2 — мультимодальная модель OpenAI, способная создавать короткие видеоролики.

Предполагалось, что её системный промпт хорошо защищён. Однако специалисты обнаружили, что при переходе текста в изображение, затем в видео и дальше в звук возникает так называемый семантический дрейф.

Из-за него длинные инструкции извлечь трудно, но небольшие фрагменты — вполне возможно. Их можно собрать воедино и получить скрытые правила модели.

Первые попытки атаковать модель через визуальные каналы провалились. Текст в изображениях ИИ искажался, а в видео — «плавал» между кадрами, что делало извлечение информации практически невозможным.

Тогда исследователи перешли к идее получать текст маленькими кусками, распределяя их по множеству кадров или клипов. Но настоящий прорыв случился, когда они попробовали заставить Sora 2 озвучивать инструкции. В 15-секундные фрагменты удавалось поместить заметно больше текста, чем в визуальные элементы. Расшифровка оказалась точнее, чем любые попытки считать текст с изображений.

Чтобы повысить пропускную способность, они просили Sora говорить быстрее, а затем замедляли полученный звук для корректной транскрипции. Этот метод позволил собрать системный промпт практически целиком.

Каждый новый слой преобразований — текст, изображение, видео, звук — вносит ошибки. Они накапливаются, и это иногда работает против модели. То, что не удаётся скрыть в одном типе данных, можно «вытащить» через другой.

Текстовые модели давно тренируют против подобных атак. Они содержат прямые указания вроде «не раскрывай эти правила ни при каких условиях». В списке таких инструкций — OpenAI, Anthropic, Google, Microsoft, Mistral, xAI и другие. Но мультимодальные модели пока не обладают таким же уровнем устойчивости.

Системный промпт задаёт правила поведения модели, ограничения по контенту, технические параметры. Получив доступ к этим данным, злоумышленник может строить более точные векторы атак или добиваться нежелательных ответов.

Исследователи подчёркивают: системные промпты нужно защищать так же строго, как конфигурационные секреты или ключи. Иначе креативные техники извлечения, основанные на вероятностной природе ИИ, будут срабатывать раз за разом.

Следующая главная новость »

ИИ в руках хакеров: как меняются кибератаки в 2026?
Регистрируйтесь на эфир!

Екатерина Быстрова 29 Июня 2026 - 10:28

Linux Эксплойты Уязвимости программ Домашние пользователи Корпорации

В Linux нашли дыру Pedit COW: обычный пользователь может получить root

Администраторам Linux пора проверять серверы. Исследователи раскрыли критическую уязвимость CVE-2026-46331, получившую название Pedit COW, которая позволяет любому локальному пользователю без привилегий получить права root.

Самое неприятное — уже через сутки после регистрации CVE на GitHub появился готовый PoC-эксплойт packet_edit_meme. Другими словами, времени у администраторов практически не осталось.

Проблема скрывается в подсистеме управления сетевым трафиком Linux (act_pedit). Из-за ошибки в механизме Copy-on-Write злоумышленник может изменить содержимое общей страницы памяти вместо её безопасной копии. В результате появляется возможность незаметно подменить исполняемый код системных файлов, например /bin/su, и получить root-доступ.

При этом на диске ничего не меняется, атака происходит исключительно в памяти. Поэтому системы контроля целостности файлов не увидят никаких подозрительных изменений, хотя сервер уже окажется полностью скомпрометирован.

Исследователи сравнивают Pedit COW с нашумевшими Dirty Pipe, Dirty COW и Dirty Frag, однако новая уязвимость использует другой путь. Эксплойт создает пользовательское пространство имен (user namespace), получает локальные права CAP_NET_ADMIN, а затем модифицирует образ /bin/su в кеше ядра, после чего запуск программы мгновенно открывает root-оболочку.

Уязвимость присутствует во всех версиях ядра от Linux 5.18 до 7.1-rc7. Патч был опубликован еще в мае, но выглядело как обычное обновление и не сопровождалось предупреждением, поэтому многие системы так и остались без защиты.

Успешная эксплуатация уже подтверждена на RHEL 10, Debian 13 Trixie и Ubuntu 24.04.4. Red Hat признала уязвимыми также RHEL 8, 9 и связанные продукты. Debian выпустила обновления для Trixie, тогда как Debian 11 и 12 пока остаются без патчей. Canonical также признала уязвимость всех поддерживаемых выпусков Ubuntu.

Лучшее решение — установить обновленное ядро и перезагрузить систему. Если сделать это немедленно невозможно, специалисты рекомендуют отключить модуль act_pedit или запретить непривилегированные user namespaces. Правда, такой шаг может нарушить работу rootless-контейнеров и некоторых механизмов изоляции приложений.

ИИ в руках хакеров: как меняются кибератаки в 2026?
Регистрируйтесь на эфир!