Европейский Союз намерен ужесточить правила по защите данных

Европейский Союз намерен ужесточить правила по защите данных

Европейский Союз предлагает упростить и одновременно ужесточить общеевропейские правила по защите данных. Согласно предложению Евросоюза, компании могут в обязательном порядке обязать разглашать данные об информационных утечках в течении 24 часов после их обнаружения.



На этой неделе ЕС реализует самый большой пакет мер за последние 17 лет, связанных с защитой информации, онлайн-реколамой и социальными сетями. Свод законов предлагает более жесткие санкции относительно нарушений, связанных с информационными утечками и приравняет общеевропейские требования к национальным, наделив общеевропейских регуляторов правом штрафовать те или иные европейские компании не на национальном, а на общеевропейском уровне. По словам еврокомиссара по вопросам юстиции Вивиан Рединг, новые правила должны стать для компаний своего рода знаком качества, получив который компания сможет заявить о себе, как об очень надежном операторе, работающим с личной информацией, сообщает cybersecurity.ru.

За прошедший год ЕС активно подвергал критике множество всемирно известных компаний, работающих с большими объемами персональных данных, таких как Sony за ее сервис Playstation Network, компании Microsoft и Google за их слежку за пользователями и других. Интересно отметить, что две последних компании уже высказались против нововведений, заявив, что они замедляют процесс инноваций и не дают компаниям стимула ко внедрению новых решений для работы с данными.

"Как компании успеют всех уведомить об утечке за 24 часа? Что может случиться, если файлы-cookie окажутся на чужом компьютере?", - задается вопросом Кей Обербек, менеджер по взаимодействию со СМИ в австрийском и швейцарском представительстве Google.

Независимые эксперты говорят, что больше других этот закон бьет по интернет-компаниям, которые собирают поведенческие данные о пользователях и передают их рекламным агентствам для проведения целевых рекламных кампаний.

В свою очередь Брюссель заявляет, что 72% европейцев в ходе недавнего опроса заявили, что их беспокоит то, как компании используют их персональные данные. Кроме того власти говорят, что последние инциденты с утечками данных миллионов пользователей заставляют идти их на такие меры. Власти Франции и Германии уже заявили, что поддержат новый свод общеевропейских законов.

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru