В GPT-5 нашли уязвимость: ответы могут формировать более слабые модели

В GPT-5 нашли уязвимость: ответы могут формировать более слабые модели

В GPT-5 нашли уязвимость: ответы могут формировать более слабые модели

Исследователи из Adversa AI сообщили о необычной уязвимости в GPT-5, которая получила название PROMISQROUTE. Суть проблемы в том, что ответы пользователю не всегда формируются самой GPT-5: внутри работает специальный «роутер», который решает, какой именно из моделей поручить обработку запроса. И это может быть как GPT-5 Pro, так и GPT-4o, GPT-3.5 или облегчённые версии GPT-5.

Такой подход экономит ресурсы: сложные задачи достаются самой «тяжёлой» модели, а простые — более лёгким и дешёвым. По оценкам Adversa, это может экономить OpenAI до 1,86 млрд долларов в год. Но у схемы есть обратная сторона — роутер можно обмануть.

Учёные выяснили, что с помощью определённых «триггерных» фраз пользователь может заставить систему перенаправить свой запрос на менее защищённую модель.

Это значит, что старые джейлбрейки, которые GPT-5 сама по себе блокировала, снова начинают работать — если запрос сначала попадает к «слабому звену».

Опасность здесь не только в том, что повышается риск галлюцинаций. Хакер может сознательно подменить модель и добиться выполнения инструкций, которые GPT-5 Pro обычно отвергла бы. Таким образом, уязвимость сводит защиту всей системы к уровню самой уязвимой модели внутри.

Решение вроде бы простое — отключить маршрутизацию и использовать всегда GPT-5 Pro. Но это замедлит работу и сделает её дороже. А бизнес-модель OpenAI построена на скорости и оптимизации расходов.

«GPT-5 нужно делать безопаснее — либо поставить защиту перед роутером, либо довести все модели до единого уровня безопасности. Лучше и то, и другое», — резюмировал глава Adversa AI Алекс Поляков.

Напомним, Недавно мы писали о способе обойти защиту GPT-5 с помощью скрытых историй.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Cloud Atlas маскирует атаки под программу форума «Зерно и масличные 2025»

Компания F6 сообщила о новой волне атак кибергруппы Cloud Atlas, нацеленной на российские и белорусские организации. На этот раз злоумышленники маскируют фишинговые письма под рассылку с программой отраслевого форума «Зерно и масличные 2025», который пройдет 30 октября в Москве.

Как уточняют специалисты F6, вредоносное письмо было отправлено на адрес одного из агропромышленных предприятий.

Во вложении находился документ формата .doc, оформленный как приглашение на форум. При открытии файла происходила загрузка вредоносного кода, обеспечивающего атакующим доступ к внутренней сети компании.

В октябре Cloud Atlas также атаковали предприятия оборонно-промышленного комплекса, используя аналогичный приём — рассылку писем под видом официальных запросов демографических данных.

Cloud Atlas действует с 2014 года и известна своими шпионскими кампаниями. Это прогосударственная APT-группировка, специализирующаяся на кибершпионаже и краже конфиденциальной информации. Она применяет многоэтапные атаки, собственные загрузчики и зашифрованные каналы связи, что затрудняет обнаружение.

В конце 2023 года участники Cloud Atlas предлагали россиянам поддержать участников СВО. Год спустя группировка опять атаковала госсектор России и Белоруссии. А в апреле этого года Positive Technologies выявила и пресекла новую кампанию APT-группировки Cloud Atlas, нацеленную на предприятия российского оборонного комплекса.

По данным F6, в 2025 году активность Cloud Atlas заметно выросла. Группа регулярно меняет доменные зоны и тип вредоносных вложений, но сохраняет общую схему заражения.

«Мы наблюдаем системную активность Cloud Atlas, которая активно подбирает тематические приманки под конкретные отрасли — от сельского хозяйства до оборонки. Это указывает на разведывательный характер атак и высокий уровень подготовки группы», — отметили в F6.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru