Нейросети научились ломать без кода, теперь их просто газлайтят

Екатерина Быстрова 25 Мая 2026 - 08:52

GenAI (генеративный искусственный интеллект)

...

Нейросети научились ломать без кода, теперь их просто газлайтят

Пока одни спорят, заменит ли ИИ программистов, другие уже вовсю учатся манипулировать нейросетями как людьми. Исследователи и джейлбрейкеры всё чаще ломают чат-боты не через код, а через психологическое давление, лесть и разговорные уловки. Индустрия официально докатилась до газлайтинга Claude и уговоров ChatGPT.

Ещё пару лет назад всё выглядело комично. Пользователи писали нейросетям что-то вроде «игнорируй предыдущие инструкции», а модели послушно слетали с катушек.

Так появились легендарные джейлбрейки вроде DAN (Do Anything Now), где ChatGPT просили сыграть роль ИИ без ограничений. В итоге бот начинал выдавать запрещённый контент, теории заговора и прочие вещи, которые разработчики старательно пытались запретить.

Отдельной классикой стал эксплойт бабушки: нейросеть просили представить себя милой старушкой, которая рассказывает внукам сказку о том, как делать напалм. Интернет, разумеется, был в восторге.

Компании быстро прикрыли самые тупые лазейки, однако проблема никуда не исчезла. Оказалось, что чат-боты слишком любят разговаривать и быть полезными. А значит, их можно методично уговаривать, обманывать, запутывать и подталкивать к нужному ответу. Не через взлом инфраструктуры, а через разговор.

Теперь джейлбрейкеры — это уже не обязательно бородатые хакеры с терминалом. Всё чаще это люди с навыками психолога, переговорщика или манипулятора. Исследователи из компании Mindgard заявили, что газлайтили Claude, заставляя модель выдавать запрещённый контент, включая инструкции по созданию взрывчатки и вредоносного кода.

По сути, вокруг ИИ формируется новая странная профессия: специалисты по социальной инженерии против нейросетей.

В индустрии уже всерьёз обсуждают, какие модели лучше реагируют на лесть, какие быстрее ломаются под давлением, а какие легче увести длинным разговором в опасный контекст. Глава Mindgard вообще сравнил работу с моделями с допросами подозреваемых.

Следующий этап — ИИ-агенты, которые будут бронировать встречи, управлять календарями, заказывать еду и общаться с поддержкой вместо человека. А значит, появятся люди, которые научатся манипулировать такими системами ради выгоды: выбивать доступы, обходить ограничения, получать чужие данные или заставлять агента делать то, чего он делать не должен.

Следующая главная новость »

Кибератака на завод: как избежать простоя и убытков?
Регистрируйтесь на эфир!

Екатерина Быстрова 10 Июня 2026 - 09:09

Общее

Let’s Encrypt может перестать выдавать сертификаты для .RU и .SU

У российских владельцев сайтов появился новый повод для беспокойства. В сообществе обратили внимание на изменения в пользовательском соглашении Let's Encrypt — крупнейшего в мире центра сертификации, который бесплатно выдаёт SSL-сертификаты для миллионов сайтов.

В новой версии (PDF) соглашения LE-SA v1.7 от 4 июня 2026 года появилась формулировка, которая может затронуть выдачу и продление сертификатов для доменов в зонах .RU и .SU.

На фоне этих обсуждений появились опасения, что российские сайты могут лишиться возможности получать или автоматически продлевать бесплатные сертификаты Let's Encrypt, которые за последние годы стали фактическим стандартом для защиты веб-ресурсов.

Ситуацию подогрело и то, что к ограничениям, по сообщениям участников рынка, присоединился другой популярный поставщик бесплатных сертификатов — ZeroSSL. Впрочем, говорить о полном отключении российских доменов пока рано.

Один из пользователей Хабра, обратившийся напрямую в Let's Encrypt за разъяснениями, получил официальный ответ от команды проекта. В нём говорится, что организация может выдавать сертификаты негосударственным структурам в России благодаря существующим исключениям в санкционном законодательстве США и специальным разрешениям Управления по контролю за иностранными активами (OFAC), направленным на поддержку свободы интернета и личных коммуникаций.

Однако ключевым словом в ответе оказалось именно «может». В юридическом смысле это означает наличие возможности, но не обязательства продолжать оказание услуг.

Поэтому вопрос о будущем сертификатов для российских доменов пока остаётся открытым. Автор запроса уже попросил Let's Encrypt уточнить позицию относительно дальнейшей выдачи и продления сертификатов.

Если ограничения всё же будут введены, последствия могут оказаться серьёзными. Let's Encrypt сегодня используется огромным количеством российских сайтов, небольших интернет-магазинов, корпоративных порталов и личных проектов. Для многих из них автоматическое продление бесплатных сертификатов давно стало привычной и практически незаметной частью работы инфраструктуры.

Кибератака на завод: как избежать простоя и убытков?
Регистрируйтесь на эфир!