Facebook предоставлял персональные данные пользователей 52 компаниям

Facebook предоставлял персональные данные пользователей 52 компаниям

Facebook предоставлял персональные данные пользователей 52 компаниям

Стали известны детали доклада Facebook касательно обращения компании с персональными данными своих пользователей. Соответствующий отчет на днях опубликовал Конгресс США.

Благодаря этому документу, занимающему 747 страниц, удалось узнать, что социальная сеть за все годы своего существования предоставила доступ к персональным данным своих пользователей 52 компаниям.

Формат опубликованного документа представляет собой ответы на вопросы членов комитета энергетики.

Примечательно, что некоторые соглашения с такими компаниями действуют и по сей день, а какие-то из них были аннулированы лишь в этом году.

В числе корпораций, которые благодаря Facebook располагали доступом к данным пользователей, есть такие гиганты, как Microsoft, Amazon и Apple. Но такое добровольное разглашение данных ушло и за пределы США — Facebook заключал подобные соглашения с южнокорейской Samsung, а также китайскими Huawei и Alibaba.

На сегодняшний день крупнейшая соцсеть прекратила сотрудничество с 38 компаниями из 52, еще с семью компаниями соглашения планируется прекратить в ближайшее время.

Ранее мы писали, что Facebook и Google обновили свои настройки конфиденциальности, чтобы соответствовать недавно принятому Общему регламенту по защите данных (GDPR), однако далеко не все остались удовлетворены. Некоторые активисты направили официальные жалобы, так как они обеспокоены тем, что эти две корпорации намеренно манипулируют людьми, заставляя их неосознанно выдавать свои данные.

Проблема кроется в хитром расположении тех или иных настроек, которые мягко побуждают пользователей выбирать те варианты, которые позволяют компаниям собирать о них информацию.

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru