Функция блокировки трекеров в Microsoft Edge больше всех бьет по Google

Функция блокировки трекеров в Microsoft Edge больше всех бьет по Google

Функция блокировки трекеров в Microsoft Edge больше всех бьет по Google

15 января 2020 года Microsoft обещает официальный релиз полностью переработанного браузера Edge для пользователей Windows и macOS. Корпорация особенно гордится функцией защиты от слежения и веб-трекеров (Tracking Prevention).

Изначально возможности Tracking Prevention появились в Internet Explorer 9 ещё в 2011 году. Тогда это было реализовано в виде простых текстовых файлов под названием Tracking Protection Lists (TPLs). Эти файлы допускали или блокировали сторонние запросы от отдельных доменов.

Принцип работы Tracking Prevention не претерпел больших изменений в Edge. Однако разработчики уделили внимание имплементации — она стала удобнее и сложнее.

Эксперты, проанализировавшие работу новой реализации Tracking Prevention, пришли к выводу, что она больше всего ударит именно по Google.

На данный момент техногигант не опубликовал официальную документацию, посвящённую Tracking Prevention, но уже известно, что пока не существует очевидного способа кастомизации функции. Например, отсутствует возможность заменить встроенные списки сторонними альтернативами.

Если вы пользуетесь предварительными билдами браузера Edge, можете найти функцию защиты от веб-трекеров на странице настроек — в разделе, посвящённом конфиденциальности и сервисам. Там можно включить или отключить Tracking Prevention, указать уровень блокировки трекеров и управлять исключениями.

По умолчанию Tracking Prevention включена, а настройки функции представляют собой сбалансированный вариант, подразумевающий блокировку потенциально опасных трекеров или скриптов отслеживания на незнакомых пользователю сайтах.

На компьютерах под управлением Windows 10 списки Trust Protection Lists располагаются  в папке профиля пользователя — %LocalAppData%\Microsoft\Edge Beta\User Data\Trust Protection Lists\. В этих файлах известные трекеры разделены на категории: рекламные, аналитические, снимающие цифровой отпечаток и принадлежащие социальным сетям.

С настройками по умолчанию Tracking Prevention в браузере Edge заблокировал в общей сложности 2318 трекеров, 552 из которых принадлежали доменам Google (23,8%). Вторым по количеству заблокированных скриптов отслеживания оказался Facebook — 3,8%.

Лидирующую позицию Google в этом вопросе специалисты объясняют бизнес-моделью интернет-гиганта: скрипты Google Analytics и Google AdSense установлены на огромном количестве ресурсов в Сети. Говорить о каком-либо заговоре против Google не приходится, подчёркивают исследователи.

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru