Генпрокуратура предложила считать посты в соцсетях поводом для проверок

Генпрокуратура предложила считать посты в соцсетях поводом для проверок

Генпрокуратура предложила считать посты в соцсетях поводом для проверок

Генеральная прокуратура Российской Федерации предложила дополнить перечень поводов для проверок публикациями на веб-сайтах, в соцсетях и мессенджерах.

На Федеральном портале проектов нормативных актов Генпрокуратура РФ разместила проект поправок к действующему приказу генерального прокурора Российской Федерации от 07.12.2007 № 195 «Об организации прокурорского надзора за исполнением законов, соблюдением прав и свобод человека и гражданина».

В нем в качестве поводов для проверок могут стать акты ревизии, результаты муниципального контроля, публикации в СМИ, радио- и телепередачи, но сетевые источники в явном виде не указаны.

31 октября Генпрокуратура также разместила проект приказа «Об особенностях организации и проведения прокурорских проверок в отношении хозяйствующих субъектов».

В нем сотрудникам ведомства прямо предписывается начинать проверки в случае поступления информации о фактах нарушения законов, требующих реагирования:

«Иметь в виду, что такая информация может содержаться в обращениях граждан, организаций и должностных лиц, сообщениях средств массовой информации, публикациях на интернет-ресурсах, в социальных сетях, мессенджерах и иных доступных источниках, материалах уголовных, гражданских, арбитражных и административных дел, актах ревизии, проверок, проведенных органами государственного контроля (надзора), муниципального контроля, других документах и материалах, содержащих конкретные сведения о возможных нарушениях закона».

Выход данных приказом почти совпал с датой обязательной регистрации телеграм-каналов более чем с 10 тыс. подписчиков в Роскомнадзоре. Однако в самом регуляторе ждут появления нормативных актов, которые регламентируют порядок такого оповещения.

«Дозвонился на основной номер РКН. Сказали, что "закон ещё находится в разработке" и информация на сайте РКН появится в ближайшее время», - сообщил автор телеграм-канала «Мятежник Джек».

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru