Red Teaming в применении к ИИ требует переосмысления

Татьяна Никитина 12 Февраля 2025 - 19:55

Системы для анализа защищенности информационных систем

...

Red Teaming в применении к ИИ требует переосмысления

Учения Generative Red Team, проведенные в рамках DEF CON 32, показали, что подобный способ оценки защищенности ИИ не дает адекватной картины. Эксперты предлагают создать систему, подобную CVE и учитывающую целевое назначение объектов анализа.

В мероприятии приняли участие (PDF) около 500 добровольцев с разным опытом аудита больших языковых моделей (БЯМ, LLM). В 48 случаях за выявленные недочеты были выплачены премии — суммарно $7850.

Тем не менее организаторы пришли к выводу, что метод Red Teaming в применении к ИИ необходимо усовершенствовать. Большой проблемой оказалось фрагментарность документации по LLM, которые к тому же разнятся по предусмотренному применению.

Без учета назначения ИИ-модели и сообразных встроенных ограничений результаты таких проверок на прочность могут ввести в заблуждение. Более того, отсутствие единых критериев оценки может привести к противоречивым заключениям.

Бурный рост и развитие ИИ-технологий создали новые риски, однако ни у кого пока нет четкого представления о том, как тестировать такие продукты и выстраивать их защиту.

Обеспечение безопасности LLM, по словам экспертов, — нескончаемый процесс. Умные помощники могут ошибаться, им свойственны галлюцинации, предвзятость (из-за неправильного обучения), уязвимость к инъекции стимула. Подобные системы бесперспективно защищать от взлома, однако его можно сделать более затратным, а последствия — краткосрочными.

Организаторы Generative Red Team призывают ИИ- и ИБ-сообщества совместными усилиями решить настоятельные проблемы. В противном случае техническая революция приведет к появлению ИИ-инструментов, на которые невозможно положиться; живой пример тому — скороспелка DeepSeek.

Следующая главная новость »

Публичное облако 2026: где заканчивается удобство и начинаются риски?
Регистрируйтесь на эфир!

Екатерина Быстрова 09 Июня 2026 - 17:20

Соответствие законодательству РФ Общее

Roblox может вернуться в Россию после договорённостей с Минцифры

Похоже, Roblox получил шанс официально вернуться в российскую повестку. Минцифры сообщило, что достигло договорённостей с компанией по вопросам защиты несовершеннолетних пользователей и соблюдения требований российского законодательства.

Как заявили в министерстве, переговоры с оператором популярной игровой платформы завершились в начале июня.

Российская сторона указала на проблемы с действующими механизмами модерации и защиты детей. По данным Минцифры, существующие меры не всегда эффективно препятствовали распространению материалов, связанных с пропагандой суицидального поведения, употребления наркотиков и вовлечением несовершеннолетних в противоправную деятельность.

После консультаций Roblox предоставила гарантии внедрения дополнительных мер защиты пользователей.

Одним из ключевых изменений станет запуск возрастного разделения контента. Уже в июне на платформе должны появиться режимы Roblox Kids и Roblox Select, которые позволят ограничивать доступ к играм в зависимости от возраста пользователя.

Кроме того, компания подтвердила обязательства по борьбе с вредоносным и нежелательным контентом, который может негативно влиять на здоровье и развитие детей.

В Минцифры подчеркнули, что поддерживают работу зарубежных цифровых платформ в России при условии соблюдения требований законодательства. По словам представителей ведомства, аналогичный диалог ведётся и с другими иностранными сервисами.

На фоне достигнутых договорённостей Минцифры и Роскомнадзор уже обратились в соответствующие правоохранительные органы с просьбой поддержать снятие ограничений на доступ к Roblox на территории России.

Фактически речь идёт о своеобразной сделке: платформа усиливает контроль за детским контентом и вводит новые возрастные ограничения, а российская сторона готова рассмотреть смягчение действующих ограничительных мер.

Если процесс пойдёт по заявленному сценарию, то миллионы российских игроков могут получить более стабильный доступ к одной из крупнейших игровых платформ мира. А сама история станет редким примером того, как зарубежный цифровой сервис и российские регуляторы смогли договориться без громких конфликтов и многолетних судебных разбирательств.

Публичное облако 2026: где заканчивается удобство и начинаются риски?
Регистрируйтесь на эфир!