В Сеть выложили личные данные тысяч информаторов полиции

В Сеть выложили личные данные тысяч информаторов полиции

В результате ошибки на публичном веб-сайте округа Меса (штат Колорадо) около семи месяцев в свободном доступе находились огромные объемы конфиденциальных данных, среди которых имена информаторов полиции и домашние адреса помощников шерифа.



Всего в результате утечки было скомпрометировано более 200 тыс. человек, чья информация находилась в базе данных компьютерной системы офиса местного шерифа. Сейчас всех пострадавших пытаются поставить в известность об утечке, сообщает Grand Junction Daily Sentinel. В первую очередь об инциденте уведомили информаторов полиции и помощников шерифа, данные которых были в базе.

Файлы содержали в себе разного рода личные данные, связанные с деятельностью офиса шерифа, а также следственные отчеты правоохранительных органов за последние 20 лет. Бывший шериф данного округа уже назвал эту утечку «кибер-катастрфой», отметив, что она ставит под угрозу жизни множества людей, чьи имена фигурируют в расследованиях.

«Это безусловно катастрофа. Принимая во внимание то, с какой информацией имеют дело представители правоохранительных органов, безопасность таких данных должна охраняться очень строго. В данном случае утечка может привести к угрозе жизни для людей, фигурирующих в расследованиях в той или иной роли», - заявил Рикки Клауссен (Riecke Claussen).

«Хотя многие люди не должны быть в этой базе данных, мы решили на всякий случай предоставить им возможность защитить себя – каждый, кто считает, что его личные данные могли быть скомпрометированы, может обратиться к нам за помощью», - отметил представитель офиса шерифа округа.

По его словам, утечка произошла из-за того, что сотрудник офиса шерифа по ошибке загрузил базу данных на открытый сервер вместо специального зашифрованного хранилища данных.

«Для небольшого округа подобная утечка стала действительно катастрофой, ведь, если верить демографическим выкладкам с официального сайта, она затронула буквально каждого жителя Меса. Отрадно, что власти, несмотря на сложность ситуации, приняли оперативные меры, в том числе выпустили специальные инструкции для пострадавших, где даны рекомендации по предотвращению незаконного использования выложенной на сайте информации и телефоны горячих линий», - отметил Александр Ковалев, директор по маркетингу компании SecurIT, российского разработчика DLP-решений.

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru