Эксперты уверены, что полномасштабная кибервойна маловероятна

Эксперты уверены, что полномасштабная кибервойна маловероятна

Cогласно исследованию по информационной безопасности, недавно проведенному британскими учеными, в будущих войнах виртуальное оружие получит широкое применение. По мнению исследователей, сама по себе компьютерная атака большой опасности не представляет, а вот организованное нападение хакеров или использования кибер-оружия в сочетании с более традиционными приемами могут иметь серьезные последствия.



Исследование, проведенное Организацией экономического сотрудничества и развития, призвано обратить внимание правительств, корпораций и политиков на то, какие опасности могут представлять кибератаки, сообщает cybersecurity.ru. Одним из авторов исследования был Питер Соммер, приглашенный профессор Лондонской школы экономики.

«На самом деле существует весьма небольшое количество кибер-угроз, которые имеют действительно глобальное значение. С другой стороны, есть много явлений, которые могут вызвать серьезные последствия на локальном уровне», – рассказывает он.

По словам другого участника исследования, Йена Брауна из Оксфордского института Интернета, большое значение могут иметь действия правительств. «Определенно, есть вероятность, что правительства будут использовать кибер-атаки как часть военной стратегии, однако, по нашему мнению, в целом маловероятно, что террористические организации, хакеры и преступные группировки будут иметь столь уж большое значение», – поясняет Браун.

Соммер убежден, что в будущих войнах компьютеры будут играть значительную роль. «В большинстве войн или менее серьезных конфликтов, которые могут вылиться в войну, кибер-оружие будет использоваться наравне с другими видами вооружения», – полагает ученый.

По мнению исследователей, наибольший вред может нанести организованная кибер-атака или же кибер-атака вкупе с происшествием другого рода – например, национальной катастрофой. Соединенные Штаты, НАТО и Великобритания уже сделали информационную безопасность одним из аспектов национальной обороны. Однако Соммер подчеркивает, что здесь им не стоит придерживаться привычного подхода: «На самом деле для решения большинства проблем требуются не военные методы, а сотрудничество между правительством и частным сектором».

В заключение специалисты ОЭСР отмечают, что настоящая кибер-война, в которой будут использоваться только компьютеры, маловероятна.

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru