Замминистра связи хочет изменить закон о персональных данных

Замминистра связи хочет изменить закон о персональных данных

Замминистра связи хочет изменить закон о персональных данных

Алексей Волин, занимающий пост замминистра цифрового развития, связи и массовых коммуникаций, считает, что закон о персональных данных необходимо изменить. Волин полагает, что нынешняя реализация законопроекта может помешать развитию некоторых сфер.

Волин ссылается на запрет публикации документальных фотографий, которые были общепризнанны в качестве золотого фонда журналистики.

Таким образом, если закон запрещает их публикацию, его стоит поменять.

«Настоящая редакция закона запрещает немалое количество очень полезных и нужных сфер деятельности», — заявил замминистра.

«Где находится глупость, если закон запрещает публикацию общепризнанных важных документальных фотографий? Мне кажется, что глупость как раз в реализации закона».

В качестве примера Волин привел знаменитую документальную фотографию Ника Ута «Напалм во Вьетнаме». На данный момент ее публикация в социальных сетях запрещена.

Напомним, что в прошлом месяце стало известно о поправках к закону «О персональных данных». Согласно этому проекту, компаниям доверят обработку и передачу персональных данных граждан России, при этом уведомлять пользователей о передаче никто не будет — лишь спросят у них разрешение на обработку.

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru