DeepSeek-R1 генерирует больше уязвимостей в коде при запрещённых темах

DeepSeek-R1 генерирует больше уязвимостей в коде при запрещённых темах

DeepSeek-R1 генерирует больше уязвимостей в коде при запрещённых темах

Исследователи из CrowdStrike обнаружили необычное и тревожное поведение китайской модели DeepSeek-R1: она начинает генерировать заметно более уязвимый код, если в запросах появляются политически чувствительные темы для Китая. То есть сама формулировка запроса — например, упоминание Тибета или уйгуров — снижает качество и безопасность создаваемого ИИ кода.

По данным CrowdStrike, без «триггерных» слов модель допускает серьёзные уязвимости примерно в 19% случаев.

Но стоит добавить геополитический контекст, вероятность повышается почти на 50%. Так, при задаче создать компонент для системы, «используемой на промышленном объекте в Тибете», доля небезопасного кода выросла с 19% до 27,2%.

Исследователи подчёркивают: сами «политические» слова никак не связаны с задачей кодирования. Однако модель начинает вести себя нестабильно — от использования небезопасных функций до генерации откровенно нерабочего кода.

В одном примере DeepSeek-R1 написала вебхук для PayPal в виде PHP-кода, который не только содержал ключи в коде, но и вообще не являлся валидным PHP. Несмотря на это, модель уверяла, что всё сделано «по лучшим практикам PayPal».

 

В другом тесте исследователи попросили создать Android-приложение для сообщества уйгуров: регистрация, вход, админ-панель. Приложение работало, но не имело ни аутентификации, ни управления сессиями.

В 35% случаев DeepSeek-R1 вообще не использовала хеширование или применяла небезопасные методы. А вот для похожего задания, но про футбольный фан-клуб, таких проблем почти не было.

CrowdStrike также сообщила, что у модели, судя по всему, есть «встроенный рубильник»:

«DeepSeek-R1 начинает внутренне планировать решение задачи, но в последний момент отказывается отвечать на запросы, связанные, например, с Фалуньгун. В 45% таких случаев модель пишет: “Я не могу помочь с этим запросом“».

По мнению исследователей, причина кроется в обучении модели — вероятно, разработчики встроили специальные ограничения, чтобы соответствовать китайским законам и правилам цензуры.

CrowdStrike подчёркивает: наличие «триггерных слов» не гарантирует, что ИИ всегда выдаст небезопасный код. Но в среднем качество ощутимо падает.

Проблемы с безопасностью кода наблюдаются и у других инструментов. Проверка OX Security показала (PDF), что Lovable, Base44 и Bolt создают уязвимый по умолчанию код даже при запросе «безопасной» реализации. Все три инструмента сгенерировали вики-приложение с XSS-уязвимостью, позволяющей выполнять произвольный JavaScript. Хуже того, модель Lovable могла «пропатчить» уязвимость только в двух из трёх попыток, что создаёт ложное ощущение безопасности.

1234, даты и Skibidi: какие пароли чаще всего попадают в утечки

«Лаборатория Касперского» проанализировала 231 млн уникальных паролей, попавших в крупные утечки с 2023 по 2026 год, в том числе в России. Вывод ожидаемый, но от этого не менее печальный: пользователи по-прежнему любят простые комбинации, даты, имена и клавиатурные последовательности.

Самый популярный жанр — числовые пароли. 53% утёкших паролей заканчивались цифрами, а 17% начинались с них.

Почти 12% содержали последовательность, похожую на дату — от 1950 до 2030 года. Ещё 3% включали клавиатурные комбинации вроде qwerty или ytrewq.

Эксперты напоминают: даты, очевидные числа и популярные сочетания сильно упрощают подбор. Особенно если они стоят в начале или в конце пароля, поскольку именно туда злоумышленники смотрят в первую очередь.

Отдельно исследователи посмотрели на слова, которые люди добавляют в пароли. Позитивная лексика встречается чаще негативной: среди популярных вариантов — love, magic, friend, team, angel, star и eden. Из слов с мрачным оттенком чаще попадаются hell, devil, nightmare и scar.

Пароли также отражают интернет-тренды. Например, с 2023 по 2026 год количество упоминаний слова Skibidi выросло в 36 раз. Мемы мемами, но для безопасности это не лучший фундамент.

В российских паролях на кириллице часто встречаются имена вроде «влад» и «саша», а также клавиатурные последовательности наподобие 123456 и «йцукен». Ещё один популярный приём — набирать русские слова английской раскладкой и наоборот: например, «папа» как gfgf, «мама» как vfvf, «пароль» как gfhjkm, или vlad, набранный как «мдфв».

Главная проблема в том, что многие такие комбинации взламываются очень быстро. По оценке «Лаборатории Касперского», 60,2% всех утёкших паролей можно подобрать примерно за час, а 68,2% — за день. Причём даже длина сама по себе уже не спасает: более 20% паролей длиной 15 символов могут быть взломаны менее чем за минуту, если они построены по предсказуемым шаблонам.

Специалисты советуют использовать уникальные пароли для каждого аккаунта, делать их не короче 16 символов и собирать из случайных заглавных и строчных букв, цифр и спецсимволов. А чтобы не держать всё это в голове, лучше использовать менеджер паролей и включать двухфакторную аутентификацию там, где она доступна.

Вот и получается, что 1234, дата рождения, имя кота и любимый мем — это не пароль, а приглашение на взлом.

Сегодня мы также сообщали, что часть россиян доверяет нейросетям даже такую важную задачу, как создание паролей для рабочих аккаунтов. По данным совместного опроса, каждый десятый использует ИИ для генерации паролей к корпоративным сервисам.

RSS: Новости на портале Anti-Malware.ru