Количество запросов на удаление и разглашение информации растет

Количество запросов на удаление и разглашение информации растет

Согласно данным последнего полугодового отчета компании Google, опубликованного сегодня, за первые полгода в компанию поступила примерно 21 000 запросов на удаление различного рода информации из поискового индекса компании. В последнем Google Transparency Report говорится, что это больше, чем в первом полугодии 2011 года, и больше, чем во втором полугодии того же года. Также в отчете компании приводятся данные по запросам, связанным с разглашением пользовательских данных.

Традиционно с большим отрывом по количеству запросов на раскрытие пользовательских данных идут США, где различные ведомства федерального и местного уровня подали в общей сложности 7969 запросов на получение закрытых данных пользователей. А вот в списке запросов на удаление контента лидирует Турция.

В Google говорят, что они, как и любая другая технологическая компания, получают множество запросов от правительственных агентств и судов по всему миру на получение доступа к тому или иному контенту, либо запросов на удаление такового с ресурсов компании. Google публикует Transparency Report дважды в год с 2009 года. С этого периода объемы запросов постоянно растут. Так, за первые полгода 2009 года компания получила 12 539 запросов, сейчас же оно составляет 20 939 запросов, сообщает cybersecurity.ru.

"Мы уже в шестой раз публикуем подобные данные и один тренд для нас стал очевиден: правительственный надзор за интернетом растет по всему миру", - говорится в блоге интернет-компании. "Это своего рода отражение местных законов. К примеру, Турция имеет законы, запрещающие оскорбление публичных фигур, а в Германии высок уровень запросов на удаление нео-нацистских ресурсов", - заявили в компании.

"В Бразилии высокий уровень запросов на удаление контента во время выборов, так как здесь закон запрещает высмеивать кандидатов. Мы надеемся, что отчет хотя бы немного прольет свет на то, как правительственные органы работают с онлайн-сервисами, и то, как принимаемыми ими законы сказываются на онлайн-сообщества", - говорят в Google.

Согласно данным компании, пятерка запросов на раскрытие пользовательской информации выглядит так: США - 7969, Индия - 2319, Бразилия - 1566, Франция - 1546, Германия - 1533 запроса.

В отчете говорится, что наиболее распространенные причины запросов на удаление данных - это оскорбления, разглашение закрытых данных и общественная безопасность. Всего в мире за первые 6 месяцев 2012 года было сделано 1789 запросов, против 1048 годом ранее. Лидером здесь является Турция - 501 запрос, из которых 148 запросов были связаны с первым президентом республики Мустафой Кемалем. Также здесь поступали запросы на удаление порно, приватных данных и материалов, защищенных авторскими правами. Помимо Турции в Топ-5 списка также попали: США - 273 запроса, Германия - 247 запросов, Бразилия - 191 запрос и Великобритания - 97 запросов.

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru