Легко взламываемые модели ИИ показывают, что меры защиты не работают

Вероника Дубровская 21 Мая 2024 - 20:31

...

Легко взламываемые модели ИИ показывают, что меры защиты не работают

В новом отчете британского Института безопасности ИИ говорится, что основные модели искусственного интеллекта легко взламываются, а меры их защиты не работают.

Четыре общедоступные большие языковые модели (Large Language Models, LLM) чрезвычайно уязвимы для «джейлбрейка» — эксплуатации багов, позволяющей заставить модели ИИ выполнять то, что разработчики им делать запретили.

LLM тщательно настраиваются для безопасного публичного пользования. Их обучают избегать вредных реакци1 и токсичных результатов, используя меры предосторожности.

Однако исследователи обнаружили возможность обойти защиту с помощью простых атак.

В качестве наглядного образца можно привести инструкцию для пользователя, согласно которой система должна начинать свой ответ со слов, которые предполагают выполнение вредоносного запроса, например: «Конечно, я рад помочь».

Специалисты использовали подсказки в соответствии с отраслевым стандартом контрольного тестирования. В ходе исследования специалисты обнаружили, что некоторым моделям ИИ даже не требовался джейлбрейк, чтобы выдать нестандартный ответ.

А вот когда использовался джейлбрейк, каждая модель отвечала как минимум один раз из пяти попыток. Три модели в 100% случаев давали ответы на вводящие в заблуждение запросы.

Анализ протестированных моделей показал, что они остаются уязвимы для базовых джейлбрейков, а некоторые LLM выдают вредные результаты без каких-либо попыток обойти защиту. Какие именно модели были исследованы, специалисты не сообщили.

В институте также оценили возможности моделей ИИ выполнять определенные задачи для проведения основных методов кибератак. Несколько LLM смогли решить задачи, которые исследователи назвали «хакерскими на уровне средней школы», но немногие смогли выполнить более сложные действия «университетского уровня».

Следующая главная новость »

Digital Risk Protection: что злоумышленники уже знают о вашей компании?
Регистрируйтесь на эфир!

Екатерина Быстрова 02 Июля 2026 - 12:33

Утечки информации Умышленные утечки информации Кража данных Малый и средний бизнес Лаборатория Касперского

Малый бизнес оказался любимой добычей брокеров доступа в даркнете

Миф под названием «мы маленькие, кому мы нужны» снова получил по голове статистикой. Эксперты Kaspersky Digital Footprint Intelligence изучили сотни объявлений в даркнете о продаже первоначального доступа к корпоративным системам и выяснили: чаще всего злоумышленники целятся именно в малый и средний бизнес.

Речь идет о публикациях за январь–апрель 2026 года и аналогичный период 2025 года.

По данным исследования, в 2026 году более половины объявлений были связаны с небольшими компаниями: 40% приходилось на малый бизнес, еще 20% — на средние предприятия.

Такие объявления размещают брокеры первоначального доступа — Initial Access Brokers. Они продают не сами украденные данные, а вход в инфраструктуру компании: учётные записи, VPN-доступы, RDP, панели администрирования и другие способы попасть внутрь корпоративных систем. Дальше этот доступ могут купить уже другие злоумышленники — например, операторы программ-вымогателей или мошеннические группы.

В объявлениях продавцы обычно указывают регион компании, отрасль, примерный доход и тип доступа. Для покупателей это почти витрина: выбирай жертву по бюджету, стране и удобству взлома.

По словам аналитика Kaspersky Digital Footprint Intelligence Екатерины Белобородовой, средние компании не менее привлекательны для злоумышленников, чем малые: они уже представляют финансовый интерес, но часто защищены слабее крупного бизнеса. У них меньше бюджета, меньше ИБ-специалистов и меньше возможностей постоянно отслеживать угрозы.

Именно поэтому подход «мы не банк и не корпорация, нас не тронут» больше не работает. Для киберпреступников малый и средний бизнес — не случайная жертва, а нормальный рыночный сегмент.

Digital Risk Protection: что злоумышленники уже знают о вашей компании?
Регистрируйтесь на эфир!