Hugging Face отзывает токены доступа к ИИ-проектам из-за взлома Spaces

Hugging Face отзывает токены доступа к ИИ-проектам из-за взлома Spaces

Hugging Face отзывает токены доступа к ИИ-проектам из-за взлома Spaces

На прошлой неделе безопасники Hugging Face выявили факт несанкционированного доступа к цифровым ID ряда пользователей Spaces. Поскольку секреты включали токены авторизации для совместной работы над ИИ-проектами, эти пропуска было решено отозвать.

Платформа Spaces предоставляет возможность создания, хранения и расшаривания приложений, использующих ИИ-технологии и алгоритмы машинного обучения. Затронутым юзерам уже разосланы имейл-уведомления об инциденте.

«Рекомендуем обновить все ключи и токены и использовать тонкую настройку доступа, которая теперь включена по умолчанию», — сказано в блог-записи Hugging Face.

В компании запущено расследование с привлечением сторонних экспертов, правоохранительные органы поставлены в известность об утечке. Приняты меры по усилению защиты инфраструктуры Spaces, создана служба управления ключами, которая будет отслеживать утечки токенов и автоматом прекращать их действие.

Токены доступа к репозиториям на чтение и запись планируется в скором времени отменить. Останутся лишь токены с тонкой настройкой, так как они позволяют ограничить доступ целевой моделью или набором данных, не расшаривая остальные ресурсы автора проекта.

В комментарии для TechCrunch представитель компании отметил, что последние пару месяцев они фиксируют рост числа атак на свои сети. Не исключено, что это связано с ростом популярности инструментов Hugging Face и расширением использования ИИ-технологий, в том числе со злым умыслом.

Новая вектор атаки заставляет ИИ не замечать опасные команды на сайтах

Специалисты LayerX описали новую атаку, которая бьёт по самому неприятному месту современных ИИ-ассистентов — разрыву между тем, что видит браузер, и тем, что анализирует модель. В результате пользователь может видеть на странице вполне конкретную вредоносную команду, а ИИ при проверке будет считать, что всё безопасно.

Схема построена на довольно изящном трюке с рендерингом шрифтов. Исследователи использовали кастомные шрифты, подмену символов и CSS, чтобы спрятать в HTML один текст, а пользователю в браузере показать совсем другой.

Для человека на странице отображается команда, которую предлагают выполнить, а вот ИИ-ассистент при анализе HTML видит только безобидное содержимое.

Именно в этом и заключается главная проблема. Ассистент смотрит на структуру страницы как на текст, а браузер превращает её в визуальную картинку. Если атакующий аккуратно разводит эти два слоя, получается ситуация, в которой пользователь и ИИ буквально смотрят на разные версии одной и той же страницы.

 

В качестве демонстрации LayerX собрала демонстрационный эксплойт на веб-странице, которая обещает некий бонус для игры BioShock, если выполнить показанную на экране команду. Пользователь, естественно, может спросить у ИИ-ассистента, безопасно ли это. И вот тут начинается самое неприятное: модель анализирует «чистую» HTML-версию, не замечает опасную команду и успокаивает пользователя.

 

То есть атака работает не за счёт взлома браузера или уязвимости в системе, а через старую добрую социальную инженерию, просто усиленную особенностями работы ИИ. Человеку показывают одно, а ассистенту — другое. И если пользователь привык доверять ответу модели, риск становится вполне реальным.

По данным LayerX, ещё в декабре 2025 года техника срабатывала против целого набора популярных ассистентов, включая ChatGPT, Claude, Copilot, Gemini, Leo, Grok, Perplexity и ряд других сервисов. При этом исследователи утверждают, что Microsoft была единственной компанией, которая приняла отчёт всерьёз и полностью закрыла проблему у себя. Остальные в основном сочли риск выходящим за рамки, потому что атака всё же требует социальной инженерии.

RSS: Новости на портале Anti-Malware.ru