Нейросети научились ломать без кода, теперь их просто газлайтят

Екатерина Быстрова 25 Мая 2026 - 08:52

GenAI (генеративный искусственный интеллект)

...

Нейросети научились ломать без кода, теперь их просто газлайтят

Пока одни спорят, заменит ли ИИ программистов, другие уже вовсю учатся манипулировать нейросетями как людьми. Исследователи и джейлбрейкеры всё чаще ломают чат-боты не через код, а через психологическое давление, лесть и разговорные уловки. Индустрия официально докатилась до газлайтинга Claude и уговоров ChatGPT.

Ещё пару лет назад всё выглядело комично. Пользователи писали нейросетям что-то вроде «игнорируй предыдущие инструкции», а модели послушно слетали с катушек.

Так появились легендарные джейлбрейки вроде DAN (Do Anything Now), где ChatGPT просили сыграть роль ИИ без ограничений. В итоге бот начинал выдавать запрещённый контент, теории заговора и прочие вещи, которые разработчики старательно пытались запретить.

Отдельной классикой стал эксплойт бабушки: нейросеть просили представить себя милой старушкой, которая рассказывает внукам сказку о том, как делать напалм. Интернет, разумеется, был в восторге.

Компании быстро прикрыли самые тупые лазейки, однако проблема никуда не исчезла. Оказалось, что чат-боты слишком любят разговаривать и быть полезными. А значит, их можно методично уговаривать, обманывать, запутывать и подталкивать к нужному ответу. Не через взлом инфраструктуры, а через разговор.

Теперь джейлбрейкеры — это уже не обязательно бородатые хакеры с терминалом. Всё чаще это люди с навыками психолога, переговорщика или манипулятора. Исследователи из компании Mindgard заявили, что газлайтили Claude, заставляя модель выдавать запрещённый контент, включая инструкции по созданию взрывчатки и вредоносного кода.

По сути, вокруг ИИ формируется новая странная профессия: специалисты по социальной инженерии против нейросетей.

В индустрии уже всерьёз обсуждают, какие модели лучше реагируют на лесть, какие быстрее ломаются под давлением, а какие легче увести длинным разговором в опасный контекст. Глава Mindgard вообще сравнил работу с моделями с допросами подозреваемых.

Следующий этап — ИИ-агенты, которые будут бронировать встречи, управлять календарями, заказывать еду и общаться с поддержкой вместо человека. А значит, появятся люди, которые научатся манипулировать такими системами ради выгоды: выбивать доступы, обходить ограничения, получать чужие данные или заставлять агента делать то, чего он делать не должен.

Следующая главная новость »

ИБ без ручного режима: как автоматизировать защиту в 2026?
Регистрируйтесь на эфир!

Екатерина Быстрова 25 Мая 2026 - 19:59

Корпорации

ARZip 2.0 ускорил создание архивов и уменьшил установщик в 20 раз

Компания ARinteg представила новую версию архиватора ARZip. В релизе 2.0 разработчики переработали производительность, уменьшили размер установочного пакета и добавили несколько новых функций для работы с архивами и интеграции с системами защиты данных.

Одно из главных изменений — ускорение создания архивов за счёт многопоточной обработки. В компании утверждают, что при использовании формата 7z/LZMA2 скорость упаковки файла размером 1,5 ГБ выросла примерно в десять раз по сравнению с ARZip 1.9.

Заодно сильно похудел и сам установочный пакет: теперь он занимает около 9,5 МБ — примерно в 20 раз меньше, чем раньше.

Интерфейс архиватора тоже обновили. Теперь создавать и открывать архивы можно в одном окне, а содержимое архива — просматривать без лишних переключений. Появилась возможность распаковывать только нужную часть архива и автоматически удалять исходные файлы после упаковки.

Поддерживается Drag&Drop: файлы и папки можно отправлять в архиватор простым перетаскиванием.

В ARZip 2.0 также добавили разграничение прав доступа для интеграции с DLP-системами, поддержку шифрования ZipCrypto, сохранение пользовательских настроек архивирования и выбор уровня сжатия.

Отдельно разработчики подчёркивают, что архиватор не использует внешние исполняемые файлы вроде 7ZIP.exe. По их словам, это снижает риск эксплуатации известных уязвимостей, которые ранее находили в WinRAR и 7-Zip.

По сути, ARZip 2.0 — это попытка сделать более современный и лёгкий архиватор с упором на скорость, интеграцию с корпоративной ИБ-инфраструктурой и минимизацию лишних зависимостей.

ИБ без ручного режима: как автоматизировать защиту в 2026?
Регистрируйтесь на эфир!