Североатлантический альянс разработает план действий на случай кибервойны

Североатлантический альянс разработает план действий на случай кибервойны

Министры обороны стран Европы в конце минувшей недели обсуждали формирование единой оборонительной стратегии НАТО в киберпространстве. Некоторые подробности этой встречи вчера изложил глава британского военного ведомства в своем выступлении перед членами парламента.



Насколько можно судить по словам министра, обсуждение соответствующих вопросов пока находится на предварительной стадии. Страны Альянса налаживают двусторонние связи и организуют обмен опытом борьбы с атаками взломщиков либо вредоносных программ, угрожающих спокойствию и работоспособности различных элементов ключевой государственной инфраструктуры. О развитии "наступательных кибервооружений" ничего сказано не было; либо вопрос не стоял на повестке дня, либо британский чиновник счел необходимым о нем не упоминать.


Концепция, которая обсуждалась на встрече министров, должна будет впоследствии определить положения политики киберобороны НАТО; последнюю, очевидно, еще только предстоит разработать. Пока же представители участников Североатлантического договора подписали меморандум о взаимопонимании, который задает формат обмена данными между входящими в Альянс государствами. За этим может последовать и подписание иных двусторонних соглашений, призванных наладить и укрепить сотрудничество в сфере кибербезопасности.


Европейцев по-прежнему нервирует приснопамятный Stuxnet: вообще говоря, именно он вынудил чиновников и дипломатов поставить на повестку дня вопросы "IT-саботажа" и других возможных актов войны в киберпространстве. Поскольку упомянутого червя иногда называют "первым в мире кибероружием", понять их опасения можно. Другими источниками беспокойства для политиков являются атаки, направленные на провоцирование отказов в обслуживании, шпионские действия взломщиков, нанятых враждебными государствами (нетрудно догадаться, какими именно - в качестве примера приводится т.н. "операция 'Аврора'", инициатором которой считается Китай), а также целевой фишинг и вирусные атаки, подобные тем, что были недавно предприняты против крупных игроков сектора нефтехимической промышленности.


Стоит напомнить, что в течение следующих четырех лет правительство Великобритании намерено истратить 650 млн. фунтов (около 30 млрд. рублей) на совершенствование средств и систем борьбы с киберугрозами. Кстати, государственные аналитики уравняли их по степени опасности с международным терроризмом.


The Register


 


================================


Слушаю Вас!
viktor.anikeenko@anti-malware.ru 

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru