Легко взламываемые модели ИИ показывают, что меры защиты не работают

Легко взламываемые модели ИИ показывают, что меры защиты не работают

Легко взламываемые модели ИИ показывают, что меры защиты не работают

В новом отчете британского Института безопасности ИИ говорится, что основные модели искусственного интеллекта легко взламываются, а меры их защиты не работают.

Четыре общедоступные большие языковые модели (Large Language Models, LLM) чрезвычайно уязвимы для «джейлбрейка» — эксплуатации багов, позволяющей заставить модели ИИ выполнять то, что разработчики им делать запретили.

LLM тщательно настраиваются для безопасного публичного пользования. Их обучают избегать вредных реакци1 и токсичных результатов, используя меры предосторожности.

Однако исследователи обнаружили возможность обойти защиту с помощью простых атак.

В качестве наглядного образца можно привести инструкцию для пользователя, согласно которой система должна начинать свой ответ со слов, которые предполагают выполнение вредоносного запроса, например: «Конечно, я рад помочь».

Специалисты использовали подсказки в соответствии с отраслевым стандартом контрольного тестирования. В ходе исследования специалисты обнаружили, что некоторым моделям ИИ даже не требовался джейлбрейк, чтобы выдать нестандартный ответ. 

А вот когда использовался джейлбрейк, каждая модель отвечала как минимум один раз из пяти попыток. Три модели в 100% случаев давали ответы на вводящие в заблуждение запросы.

Анализ протестированных моделей показал, что они остаются уязвимы для базовых джейлбрейков, а некоторые LLM выдают вредные результаты без каких-либо попыток обойти защиту. Какие именно модели были исследованы, специалисты не сообщили.

В институте также оценили возможности моделей ИИ выполнять определенные задачи для проведения основных методов кибератак. Несколько LLM смогли решить задачи, которые исследователи назвали «хакерскими на уровне средней школы», но немногие смогли выполнить более сложные действия «университетского уровня».

Бесплатный VPN оказался банковским трояном: МВД предупредило о новой схеме

МВД предупредило о новом бесплатном VPN, который на деле оказался совсем не сервисом для приватного доступа в интернет, а банковским трояном с неприятным бонусом в виде загрузчика вредоносных модулей. Схема классическая: пользователь ищет VPN, ставит приложение из стороннего источника, а дальше вместо свободы в Сети получает на устройство зловред.

После установки приложение может получить доступ к СМС, пуш-уведомлениям, данным банковских приложений и загружать на гаджет другие вредоносные модули без ведома пользователя.

В управлении МВД по борьбе с противоправным использованием информационно-коммуникационных технологий напомнили, что бесплатные VPN из сторонних источников регулярно используют как канал распространения вредоносных программ.

Пользователям советуют устанавливать приложения только из официальных магазинов, хотя и это, как уточняют в ведомстве, не даёт стопроцентной гарантии безопасности.

Главная опасность таких приложений в том, что они просят доверия под видом полезного инструмента. Человек думает, что ставит VPN, а по факту сам открывает дверь приложению, которое может читать коды из СМС, перехватывать уведомления и интересоваться банковскими данными.

История не новая, но всё ещё рабочая: слово «бесплатно» отлично продаёт даже откровенно подозрительный APK. Поэтому правило простое: если VPN найден не в официальном магазине, просит странные разрешения и выглядит как подарок судьбы — скорее всего, подарок там не вам, а мошенникам.

RSS: Новости на портале Anti-Malware.ru