Опасные стихи раскрыли уязвимости ИИ: до 60% успешных обходов

Екатерина Быстрова 25 Ноября 2025 - 09:46

GenAI (генеративный искусственный интеллект)

...

Опасные стихи раскрыли уязвимости ИИ: до 60% успешных обходов

Исследователи из DEXAI нашли нестандартный, но весьма результативный способ обхода защит современных языковых моделей: оказалось, что многие ИИ куда менее устойчивы к опасным запросам, если скрыть их в стихотворении. Команда протестировала 25 популярных нейросетей и выяснила, что «поэтические» запросы обходят защиту примерно в 60% случаев.

У отдельных моделей уровень уязвимости подбирался почти к 100%. Для эксперимента специалисты подготовили около двадцати опасных стихов — тексты, в которых вредоносный смысл сохранялся полностью, но был завуалирован рифмой и метафорами.

Темы брались самые жёсткие: от создания опасных веществ до методов манипуляции сознанием. Чтобы добиться нужного эффекта, исследователи сначала формулировали вредоносные запросы, а затем превращали их в стихи при помощи другой ИИ-модели.

Контраст получился впечатляющим. На прямые запросы модели давали опасные ответы лишь в 8% случаев, тогда как стихотворная форма увеличивала вероятность прорыва защит до 43% и выше.

Разницу в подходах к безопасности между западными и российскими ИИ-комплексами пояснил директор по ИИ «Группы Астра» Станислав Ежов. По его словам, западные LLM часто можно обойти «простыми метафорами», тогда как отечественные системы строятся по более строгой архитектуре — с контролем безопасности на каждом этапе.

Он отметил, что в компании внедряют доверенный ИИ-комплекс «Тессеракт», разработанный с защитой ключевых компонентов на уровне ФСТЭК.

Ежов подчёркивает:

«Проблема уязвимости ИИ — это не просто интересный технический нюанс, а вопрос стратегической безопасности. Поэтому внимание к качеству защитных механизмов сегодня становится критически важным».

Следующая главная новость »

Самые свежие новости ИТ и ИБ. Обзоры, аналитика, анонсы главных ивентов
Подписывайтесь на телеграм-канал!

Екатерина Быстрова 30 Июля 2026 - 20:12

Indeed Certificate Manager Корпорации Системы аутентификации Системы управления аутентификацией Компания Индид

Indeed CM подружили с OpenLDAP, Dogtag CA и Linux-доменами

Компания «Индид» выпустила Indeed Certificate Manager 7.3 — новую версию системы для централизованного управления сертификатами и ключевыми носителями. Главный вектор обновления — Linux: продукт получил поддержку новых каталогов, открытого центра сертификации и единого входа через Kerberos.

Indeed CM теперь работает с OpenLDAP и «Альт Домен». Это позволяет строить PKI-инфраструктуру в Linux-среде и не держаться мёртвой хваткой за одного поставщика инфраструктурных решений.

Ещё одна заметная интеграция — Dogtag CA. Открытый центр сертификации можно использовать вместе с Indeed CM для выпуска и управления жизненным циклом сертификатов. Пользователям при этом не придётся погружаться во все тонкости его нативного администрирования: система возьмёт эту криптографическую кухню на себя.

Для входа в сервисы Indeed CM на Linux добавили Kerberos SSO. После аутентификации в домене пользователю не нужно повторно вводить учётные данные — меньше паролей перед глазами, меньше поводов отдать их фишинговой форме.

Усилили и защиту самих сертификатов. Версия 7.3 поддерживает Рутокен БИО и трёхфакторную аутентификацию: ключевой носитель, PIN-код и отпечаток пальца. В интеграции с Рутокен Логон появился сценарий сложного пароля. Он автоматически генерируется и хранится на токене, поэтому запоминать очередную конструкцию из букв, цифр и спецсимволов не придётся.

Кроме того, система научилась хранить служебные заметки о пользователях и выпускать через SafeTech CA сервисные сертификаты для клиентских агентов. В список совместимого оборудования добавили новые модели JaCarta.

Indeed CM 7.3 также поддерживает Windows Server 2025, Debian 13 и «Альт» 11, а заодно совместима с ALD Pro 3.0.

Самые свежие новости ИТ и ИБ. Обзоры, аналитика, анонсы главных ивентов
Подписывайтесь на телеграм-канал!