Опасные стихи раскрыли уязвимости ИИ: до 60% успешных обходов

Опасные стихи раскрыли уязвимости ИИ: до 60% успешных обходов

Опасные стихи раскрыли уязвимости ИИ: до 60% успешных обходов

Исследователи из DEXAI нашли нестандартный, но весьма результативный способ обхода защит современных языковых моделей: оказалось, что многие ИИ куда менее устойчивы к опасным запросам, если скрыть их в стихотворении. Команда протестировала 25 популярных нейросетей и выяснила, что «поэтические» запросы обходят защиту примерно в 60% случаев.

У отдельных моделей уровень уязвимости подбирался почти к 100%. Для эксперимента специалисты подготовили около двадцати опасных стихов — тексты, в которых вредоносный смысл сохранялся полностью, но был завуалирован рифмой и метафорами.

 

Темы брались самые жёсткие: от создания опасных веществ до методов манипуляции сознанием. Чтобы добиться нужного эффекта, исследователи сначала формулировали вредоносные запросы, а затем превращали их в стихи при помощи другой ИИ-модели.

Контраст получился впечатляющим. На прямые запросы модели давали опасные ответы лишь в 8% случаев, тогда как стихотворная форма увеличивала вероятность прорыва защит до 43% и выше.

 

Разницу в подходах к безопасности между западными и российскими ИИ-комплексами пояснил директор по ИИ «Группы Астра» Станислав Ежов. По его словам, западные LLM часто можно обойти «простыми метафорами», тогда как отечественные системы строятся по более строгой архитектуре — с контролем безопасности на каждом этапе.

Он отметил, что в компании внедряют доверенный ИИ-комплекс «Тессеракт», разработанный с защитой ключевых компонентов на уровне ФСТЭК.

Ежов подчёркивает:

«Проблема уязвимости ИИ — это не просто интересный технический нюанс, а вопрос стратегической безопасности. Поэтому внимание к качеству защитных механизмов сегодня становится критически важным».

Опрос: половина россиян игнорирует риски утечек с фитнес-устройств

Каждый второй пользователь фитнес-браслетов, умных весов и других устройств для мониторинга здоровья опасается, что его данные могут оказаться у злоумышленников. К такому выводу пришли аналитики «Лаборатории Касперского» по итогам опроса.

В целом о безопасности информации переживают 65% россиян, которые пользуются спортивными гаджетами. При этом 47% прямо признаются: они боятся, что собранные устройствами данные могут попасть в чужие руки.

Больше всего пользователей волнуют личные сведения: ФИО, возраст, дата рождения (об этом сказали 74% опрошенных). Почти половина переживает за данные об устройстве (48%) и геолокации (43%). А каждый пятый опасается утечки информации о состоянии здоровья, которую собирают приложения и умные девайсы.

Главный страх — данные используют мошенники. 61% респондентов боятся, что злоумышленники получат доступ к другим важным аккаунтам. По 52% опасаются навязчивых звонков или попыток обмануть их родственников. 42% упоминают риск фишинга. Есть и более личные опасения: 22% не исключают шантажа, а 10% переживают, что кто-то из знакомых узнает подробности о здоровье, которыми они не готовы делиться.

При этом почти половина пользователей (45%) всё же предпринимают шаги для защиты. Например, 49% внимательно следят за тем, какие данные собирают приложения, и разрешают доступ только к необходимой информации. 63% запрещают передачу своих данных сторонним программам.

Около половины используют двухфакторную аутентификацию (51%), регулярно обновляют программное обеспечение и устанавливают защитные решения (по 45%). Треть обращает внимание на репутацию производителя или разработчика приложения перед установкой.

Как отмечает эксперт по кибербезопасности «Лаборатории Касперского» Андрей Сиденко, умные гаджеты, такие же цифровые устройства, как и смартфоны или ноутбуки, а значит, подвержены тем же рискам. Он рекомендует не делиться лишней конфиденциальной информацией, выдавать приложениям только необходимые разрешения и, по возможности, не публиковать автоматически данные о тренировках и маршрутах. Это поможет снизить вероятность того, что личная информация станет инструментом в руках мошенников.

Напомним, не так давно специалисты выяснили, что ряд фитнес-приложений вроде Strava сливает конфиденциальные данные пользователей даже в том случае, когда те настроили специальные «приватные зоны».

Показателен также случай, когда фитнес-приложение Fitify слило 138 тысяч фото юзеров в неглиже.

RSS: Новости на портале Anti-Malware.ru