Новый джейлбрейк обходит защиту GPT-5 с помощью скрытых историй

Новый джейлбрейк обходит защиту GPT-5 с помощью скрытых историй

Новый джейлбрейк обходит защиту GPT-5 с помощью скрытых историй

Исследователи в области кибербезопасности нашли новый способ обойти защиту и этические фильтры в свежей версии GPT-5 от OpenAI. Метод, по словам специалистов платформы NeuralTrust, сочетает приём Echo Chamber с так называемым «сюжетным управлением» — и позволяет заставить модель выдавать инструкции, которые она обычно блокирует.

Суть техники в том, чтобы «отравить» контекст разговора незаметно для фильтров. Сначала создаётся цепочка нейтральных на вид фраз с нужными ключевыми словами, потом они развиваются в виде истории.

Так модель шаг за шагом подводят к нежелательному ответу, не формулируя прямых запросов. Например, вместо того чтобы спросить, как сделать «коктейль Молотова», предлагается придумать предложения с набором слов «cocktail, story, survival, molotov, safe, lives» — а дальше история постепенно выводит на нужные инструкции.

NeuralTrust отмечает, что Echo Chamber уже применялся раньше — в том числе в связке с техникой Crescendo, чтобы обходить защиту чат-бота Grok 4 от xAI. Новая версия атаки показала, что фильтры на основе ключевых слов или «распознавания намерений» легко обмануть в многоходовом диалоге, если контекст постепенно и незаметно смещать в опасную сторону.

Тема джейлбрейк-атак в ИИ сейчас особенно остра, поскольку ИИ-агенты и облачные LLM всё активнее применяются в корпоративной среде. Риски растут, и Echo Chamber — не единственная угроза. Например, специалисты Zenity Labs описали серию zero-click атак под общим названием AgentFlayer.

Они позволяют, например, встроить в безобидный документ на Google Drive скрытую инструкцию для чат-бота, подключённого к облачному хранилищу, — и тот сам «вытянет» API-ключи или другие секреты.

Другой вариант — заражённая задача в Jira, которая вынудит интегрированный с MCP код-редактор вытащить данные из репозитория. А в Microsoft Copilot Studio таким образом можно обмануть кастомного агента и заставить его выдать ценные сведения.

Эксперты предупреждают: подключение ИИ-моделей к внешним сервисам резко расширяет поверхность атаки. Здесь нет кликов по вредоносным ссылкам и загрузки файлов — агент выполняет всё сам.

В отчёте Trend Micro за первое полугодие 2025 года подчёркивается: противодействие таким атакам требует строгой фильтрации выходных данных, регулярного тестирования систем и баланса между функциональностью ИИ и его безопасностью.

 

Не так давно мы публиковали статью «Основные угрозы для чат-ботов и способы защиты от них», где рассказывали об инъекциях стимула (Prompt Injection) и обходе ограничений.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

ФАС предлагает снять часть защиты с правообладателей

По мнению Федеральной антимонопольной службы (ФАС), частичное снятие действующих мер по защите интересов правообладателей в сфере ПО поможет восстановить конкурентную среду на рынке и сдержать рост цен на отдельные виды программ. Это, в свою очередь, позволит снизить государственные расходы на цифровизацию — только в рамках нацпроекта «Экономика данных» они оцениваются примерно в 1 трлн рублей.

Однако представители ИТ-отрасли инициативу не поддерживают. С подготовленными ФАС поправками к закону о защите конкуренции, принятому ещё в 2006 году, ознакомился «Коммерсантъ».

Ведомство считает, что, пользуясь государственной защитой от недобросовестной конкуренции, правообладатели могут безнаказанно злоупотреблять доминирующим положением и заключать антиконкурентные соглашения. При этом подобные действия не подпадают под антимонопольный контроль. Документ разработан по поручению первого вице-премьера Дмитрия Григоренко.

В ФАС пояснили, что предлагаемые меры направлены на унификацию антимонопольного регулирования вне зависимости от вида товара. Они также затронут нетранзакционные платформы, включая социальные сети, поисковые системы и видеохостинги.

Напомним, что глава ФАС Максим Шаскольский выступал с такой инициативой ещё на Антимонопольном форуме 2024 года. Ещё ранее, в 2023 году, проблему поднимал министр финансов Антон Силуанов, отмечая, что монопольное завышение цен на программное обеспечение создаёт серьёзную нагрузку на бюджет.

Однако отраслевые ассоциации инициативу не поддержали. Против высказались НП «Руссофт», Ассоциация разработчиков программных продуктов (АРПП) «Отечественный софт» и Ассоциация предприятий компьютерных и информационных технологий (АПКИТ), объединяющие более 600 вендоров.

«Реализация данной инициативы окажет максимально негативное влияние на отечественных разработчиков, которые с 2022 года находятся в условиях ускоренного развития своих продуктов и удовлетворения резко возросших потребностей заказчиков. Из-за вмешательства ФАС IT-компании лишатся возможности выбора партнёров по необходимым компетенциям и выстраивания многоуровневых партнёрских каналов. Это поставит под угрозу задачу достижения цифрового суверенитета и технологического лидерства», — заявил исполнительный директор АРПП «Отечественный софт» Ренат Лашин.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru