Роскомнадзор; за год в Сеть утекло более 710 млн записей с данными граждан

Роскомнадзор; за год в Сеть утекло более 710 млн записей с данными граждан

Роскомнадзор; за год в Сеть утекло более 710 млн записей с данными граждан

В 2024 году Роскомнадзор зафиксировал 135 случаев утечки баз данных. Суммарно в общий доступ было слито свыше 710 млн записей, содержащих персональные данные жителей России.

Для сравнения: за 11 месяцев прошлого года РКН взял на карандаш 127 утечек баз данных общим объемом более 680 млн записей.

«В 2024 году Роскомнадзор зафиксировал 135 случаев распространения в интернете баз данных, содержащих более 710 миллионов записей», — цитирует РИА Новости новые вводные регулятора.

Примечательно, что объемы утечек ПДн в России растут, а число таких инцидентов снижается. Так, по оценке DLBI, в I квартале 2024 года объем утечек данных в России в пять раз превысил показатель годовой давности.

Чаще всего взломам подвергались компании-подрядчики (ИТ и маркетинг), в таких случаях утечка может также затронуть заказчиков и их клиентов. Больше всего данных, по словам экспертов, утекло из финансовых организаций.

Основными причинами утечек данных в российских организациях, по данным Solar JSOC, являются компрометация корпоративных учеток и незакрытые уязвимости на ИТ-периметре.

Ввиду роста угрозы Национальный координационный центр по компьютерным инцидентам (НКЦКИ) запустил бесплатный сервис проверки утечки личных данных, аналогичный Have I Been Pwned. Поиск осуществляется по сводной базе, регулярно пополняемой из открытых источников.

В конце ноября президент России Владимир Путин подписал закон, ужесточающий штрафы за утечку персональных данных. Размер штрафа теперь зависит от величины потерь: так, за утечку данных более 100 тыс. субъектов ПДн или свыше 1 млн идентификаторов с компании могут взыскать до 15 млн руб., а при рецидиве — до 500 млн рублей.

Так называемый закон об оборотных штрафах вступит в силу через полгода. Специалисты по ИБ считают, что новая законодательная мера способна изменить отношение бизнеса к безопасности персданных и заставит его больше вкладываться в киберзащиту.

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru