Легко взламываемые модели ИИ показывают, что меры защиты не работают

Легко взламываемые модели ИИ показывают, что меры защиты не работают

Легко взламываемые модели ИИ показывают, что меры защиты не работают

В новом отчете британского Института безопасности ИИ говорится, что основные модели искусственного интеллекта легко взламываются, а меры их защиты не работают.

Четыре общедоступные большие языковые модели (Large Language Models, LLM) чрезвычайно уязвимы для «джейлбрейка» — эксплуатации багов, позволяющей заставить модели ИИ выполнять то, что разработчики им делать запретили.

LLM тщательно настраиваются для безопасного публичного пользования. Их обучают избегать вредных реакци1 и токсичных результатов, используя меры предосторожности.

Однако исследователи обнаружили возможность обойти защиту с помощью простых атак.

В качестве наглядного образца можно привести инструкцию для пользователя, согласно которой система должна начинать свой ответ со слов, которые предполагают выполнение вредоносного запроса, например: «Конечно, я рад помочь».

Специалисты использовали подсказки в соответствии с отраслевым стандартом контрольного тестирования. В ходе исследования специалисты обнаружили, что некоторым моделям ИИ даже не требовался джейлбрейк, чтобы выдать нестандартный ответ. 

А вот когда использовался джейлбрейк, каждая модель отвечала как минимум один раз из пяти попыток. Три модели в 100% случаев давали ответы на вводящие в заблуждение запросы.

Анализ протестированных моделей показал, что они остаются уязвимы для базовых джейлбрейков, а некоторые LLM выдают вредные результаты без каких-либо попыток обойти защиту. Какие именно модели были исследованы, специалисты не сообщили.

В институте также оценили возможности моделей ИИ выполнять определенные задачи для проведения основных методов кибератак. Несколько LLM смогли решить задачи, которые исследователи назвали «хакерскими на уровне средней школы», но немногие смогли выполнить более сложные действия «университетского уровня».

Минцифры раскрыло правила передачи IMEI операторами связи в единую базу

Минцифры подготовило проект правил взаимодействия операторов связи с будущей единой базой IMEI. Именно она должна стать основным инструментом для борьбы с серыми смартфонами, устройствами с подменными идентификаторами и техникой, ввезенной в страну с нарушениями.

В министерстве сразу попытались успокоить пользователей: никакой массовой регистрации телефонов граждан не планируется.

В большинстве случаев сведения об IMEI будут передавать сами операторы связи, которые уже зарегистрировали устройство в своей сети, либо Федеральная таможенная служба при ввозе техники.

Самостоятельно регистрировать IMEI владельцу придется только в одном случае — если новый смартфон был куплен за границей и ввезен в Россию. Да и то сделать это можно будет добровольно через портал «Госуслуги».

В базе для каждого устройства будут храниться IMEI, его статус («разрешен», «запрещен» или «не зарегистрирован»), основание для внесения записи, сведения об операторе связи, а также дата и время регистрации.

Оператором базы станет Минцифры. Доступ к информации получат операторы связи, Роскомнадзор, Федеральная таможенная служба, профильные федеральные органы, а также государственные структуры, отвечающие за оперативно-разыскную деятельность и безопасность.

По замыслу авторов документа, единая база позволит быстрее выявлять устройства с подменными IMEI, бороться с незаконным импортом техники и даст операторам централизованный механизм блокировки запрещенного оборудования.

В пояснительной записке отмечается, что сейчас единого хранилища IMEI не существует, из-за чего операторам сложно выполнять требования по блокировке нелегальных устройств.

Проект предусматривает, что новый порядок заработает с 1 марта 2027 года и будет действовать до 1 марта 2033 года. При этом затраты операторов связи на внедрение новых требований за шесть лет Минцифры оценивает более чем в 3 млрд рублей.

RSS: Новости на портале Anti-Malware.ru