ФСТЭК потребует завершения категорирования объектов КИИ в 2019 году

ФСТЭК потребует завершения категорирования объектов КИИ в 2019 году

ФСТЭК потребует завершения категорирования объектов КИИ в 2019 году

Заместитель директора ФСТЭК России Виталий Лютиков прокомментировал вопрос категорирования объектов КИИ и сроков исполнения. На проходящей сегодня конференции SOC Forum было озвучено, что категорирование необходимо завершить до конца 2019 года.

Всего с начала этого года ФСТЭК отклонил данные, поданные по более 600 объектам КИИ. В качестве причины было указано отсутствие обоснования выбранной категории КИИ.

Основными задерживающими процесс организациями являются операторы связи и кредитные организации.

«Отговорки насчет большого количества объектов не принимаются, так как есть крупные предприятия, которые обработали уже более 1000 объектов и разработали необходимые собственные документы», — выступая на SOC Forum, заявил Лютиков.

Также замдиректора ФСТЭК России обратил внимание на 239 приказ (ОБ УТВЕРЖДЕНИИ ТРЕБОВАНИЙ ПО ОБЕСПЕЧЕНИЮ БЕЗОПАСНОСТИ ЗНАЧИМЫХ ОБЪЕКТОВ КРИТИЧЕСКОЙ ИНФОРМАЦИОННОЙ ИНФРАСТРУКТУРЫ РОССИЙСКОЙ ФЕДЕРАЦИИ) — в следующем году должны быть представлены методические документы по этому приказу.

Было отмечено, что на данном этапе государственный контроль значимых объектов не ведется.

«Отраслевые документы и стандарты поддерживаются, но они не должны тормозить исполнение закона», — считает Лютиков.

Категорирование планируют закончить до конца 2019 года.

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru