Нейросети научились ломать без кода, теперь их просто газлайтят

Екатерина Быстрова 25 Мая 2026 - 08:52

GenAI (генеративный искусственный интеллект)

...

Нейросети научились ломать без кода, теперь их просто газлайтят

Пока одни спорят, заменит ли ИИ программистов, другие уже вовсю учатся манипулировать нейросетями как людьми. Исследователи и джейлбрейкеры всё чаще ломают чат-боты не через код, а через психологическое давление, лесть и разговорные уловки. Индустрия официально докатилась до газлайтинга Claude и уговоров ChatGPT.

Ещё пару лет назад всё выглядело комично. Пользователи писали нейросетям что-то вроде «игнорируй предыдущие инструкции», а модели послушно слетали с катушек.

Так появились легендарные джейлбрейки вроде DAN (Do Anything Now), где ChatGPT просили сыграть роль ИИ без ограничений. В итоге бот начинал выдавать запрещённый контент, теории заговора и прочие вещи, которые разработчики старательно пытались запретить.

Отдельной классикой стал эксплойт бабушки: нейросеть просили представить себя милой старушкой, которая рассказывает внукам сказку о том, как делать напалм. Интернет, разумеется, был в восторге.

Компании быстро прикрыли самые тупые лазейки, однако проблема никуда не исчезла. Оказалось, что чат-боты слишком любят разговаривать и быть полезными. А значит, их можно методично уговаривать, обманывать, запутывать и подталкивать к нужному ответу. Не через взлом инфраструктуры, а через разговор.

Теперь джейлбрейкеры — это уже не обязательно бородатые хакеры с терминалом. Всё чаще это люди с навыками психолога, переговорщика или манипулятора. Исследователи из компании Mindgard заявили, что газлайтили Claude, заставляя модель выдавать запрещённый контент, включая инструкции по созданию взрывчатки и вредоносного кода.

По сути, вокруг ИИ формируется новая странная профессия: специалисты по социальной инженерии против нейросетей.

В индустрии уже всерьёз обсуждают, какие модели лучше реагируют на лесть, какие быстрее ломаются под давлением, а какие легче увести длинным разговором в опасный контекст. Глава Mindgard вообще сравнил работу с моделями с допросами подозреваемых.

Следующий этап — ИИ-агенты, которые будут бронировать встречи, управлять календарями, заказывать еду и общаться с поддержкой вместо человека. А значит, появятся люди, которые научатся манипулировать такими системами ради выгоды: выбивать доступы, обходить ограничения, получать чужие данные или заставлять агента делать то, чего он делать не должен.

Следующая главная новость »

ИБ без ручного режима: как автоматизировать защиту в 2026?
Регистрируйтесь на эфир!

Екатерина Быстрова 25 Мая 2026 - 19:33

Мошенничество Онлайн-мошенничество Общее Лаборатория Касперского

Интерпол и Kaspersky помогли задержать 200 предполагаемых кибермошенников

«Лаборатория Касперского» приняла участие в операции Интерпола Ramz, направленной против киберпреступности на Ближнем Востоке и в Северной Африке. Итог получился внушительный: 201 подозреваемый арестован, ещё 382 человека попали в поле зрения правоохранителей.

Операция проходила с октября 2025 года по февраль 2026-го и стала первой масштабной кампанией Интерпола такого рода в регионе MENA. В ней участвовали представители 13 стран.

Целью были вредоносная активность, фишинг, скам и другие схемы, из-за которых пострадали около 4 тысяч человек.

«Лаборатория Касперского» передала Интерполу технические данные о киберугрозах и инфраструктуре, которую злоумышленники использовали для администрирования и распространения вредоносных программ. В том числе речь шла о серверах, через которые работали преступные схемы.

Всего страны-участницы получили почти 8 тысяч фрагментов данных. Эти сведения помогли запускать расследования, искать скомпрометированные устройства, вычислять серверы и изымать оборудование.

В Катаре на основе полученных данных удалось определить заражённые устройства и уведомить их владельцев. В Иордании полиция нашла компьютер, который использовался в финансовом мошенничестве: жертв уговаривали вложиться в якобы легальную торговую платформу, а после перевода денег доступ к ней просто закрывался.

В Омане правоохранители обнаружили в частном доме сервер с конфиденциальной информацией и отключили его, чтобы остановить дальнейший ущерб. В Алжире заблокировали сайт, где по модели «фишинг как услуга» продавались инструменты для атак, а затем изъяли сервер, компьютер, телефон и жёсткие диски. В Марокко также изъяли устройства с банковскими данными и ПО для фишинговых схем.

Директор управления Интерпола по борьбе с киберпреступностью Нил Джеттон отметил, что операция показала эффективность международного сотрудничества против преступных группировок, которые используют цифровую инфраструктуру почти без границ.

В «Лаборатории Касперского» подчеркнули, что быстрый обмен данными между ИБ-компаниями и правоохранителями помогает не просто красиво писать отчёты, а реально отключать серверы, находить подозреваемых и ломать преступные цепочки.

ИБ без ручного режима: как автоматизировать защиту в 2026?
Регистрируйтесь на эфир!