США и Россия договариваются о кибервойнах

США и Россия договариваются о кибервойнах

...

Россия и ООН приступили к переговорам в сфере обеспечения безопасности в Интернете и ограничения военного использования киберпространства. Москва и Вашингтон пока не могут прийти к консенсусу, однако, по словам осведомленных источников, в последнее время в процессе сближения позиций наметился определенный прогресс благодаря смягчению американской стороны. Раньше, утверждают эксперты, любые инициативы России в вопросах кибербезопасности Соединенные Штаты критиковали и не брали в расчет.

Теперь же страны согласны в главном – мировую гонку вооружений в Сети необходимо обуздать и поставить в определенные рамки.

В последние пару лет интернет-атаки на правительственные и корпоративные системы США участились настолько, что порой их число доходит до нескольких тысяч в день. Хакеры, которых практически невозможно идентифицировать географически, постоянно взламывают мощные компьютеры Пентагона, воруют секретную промышленную информацию и на долгое время блокируют работу порталов государственных министерств и крупных компаний.

Президент Обама приказал провести масштабное исследование электронной безопасности и собирается назначить чиновника, в чью компетенцию будут входить вопросы борьбы с сетевыми нападениями.

В ноябре в Вашингтоне состоялась встреча между экспертами из России и США. Российскую делегацию возглавлял первый заместитель секретаря Совбеза Владислав Шерстюк. По словам участников форума, стороны достигли значительного прогресса, разрушив многие преграды, долгие года мешавшие активизации межгосударственных контактов.

Уже через две недели после переговоров в американской столице в Женеве США объявили о начале сотрудничества с комитетом ООН по разоружению и международной безопасности в вопросах предотвращения войн в киберпространстве.

Российская сторона настаивает на том, что сетевые угрозы можно предотвращать лишь на основе четких договоренностей, подобных документам в сфере нераспространения ядерного, химического и биологического оружия. Американцы долгое время полагали, что невозможно провести черту между коммерческим и военным использованием компьютерных технологий, а потому любые документы будут бессмысленны и априори неисполнимы.

Однако киберпреступность превратилась в слишком серьезную проблему, которую просто невозможно не замечать, констатируют эксперты.

Напомним, в марте этого года компьютерные эксперты разоблачили целую группу китайских хакеров, которые заразили вирусами стратегические объекты в 103 странах.

Источник 

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru