Российские регуляторы согласовали регламент внесудебной блокировки сайтов

Российские регуляторы согласовали регламент внесудебной блокировки сайтов

Российские регуляторы согласовали регламент внесудебной блокировки сайтов

Генпрокуратура России, Минцифры и Роскомнадзор разработали законопроект, закрепляющий использование специализированной ИС в рамках процедуры оперативной блокировки противоправного контента в рунете.

Как пояснили в пресс-службе Генпрокуратуры, данная инициатива направлена на совершенствование механизма противодействия распространению запрещенной в стране информации. О какой ИС идет речь, пока можно только догадываться.

«Совместными усилиями разработан законопроект, регламентирующий оперативное решение по блокированию вредоносных сайтов с использованием специализированной информационной системы», — цитирует ТАСС комментарий, полученный в ответ на запрос.

Журналистам также сообщили, что в минувшем году Генпрокуратура суммарно направила в РКН более 2000 требований о внесудебном ограничении интернет-доступа к информации — против 1699 в 2022 году. Правонарушения были выявлены посредством мониторинга публикаций, в том числе в мессенджерах и соцсетях.

Еще 306 аналогичных требований касались предложений купить поддельные документы, вложить деньги в якобы перспективные проекты (сайты финансовых пирамид), получить кредит в обход существующих норм. Всего было выявлено свыше 40 тыс. таких ресурсов.

Напомним, сайты, веб-страницы, приложения, распространяющие запрещенную законом информацию, Роскомнадзор вносит в специальный реестр. Туда вносятся ресурсы, продвигающие порно, наркотики, азартные игры, материалы экстремистского характера и т. п.

В черный список регулятора могут попасть сервисы, игнорирующие российские запреты, а с марта этого года — также сайты с информацией о методах обхода блокировок, действующих в рунете. Ограничение доступа к таким ресурсам осуществляется на уровне провайдера — с помощью технических средств противодействия угрозам, ТСПУ.

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru