Взломаны компьютеры

В Баку взломали компьютеры помощников Еврокомиссара

Ноутбуки, которые принадлежат членам Европейской комиссии, были взломаны во время посещения чиновниками правительственной конференции в Азербайджане. Об атаке рассказала Еврокомиссар Нелли Кроес, опубликовав соответствующий пост в блоге, после посещения Internet Governance Forum (IGF) в Баку.

О том, что компьютеры оказались под угрозой взлома политики узнали из-за предупреждения системы компьютерной безопасности Apple. Представители Азербайджана сказали, что они рассмотрят официальную жалобу.

В блоге госпожа Кроес сказала, что она сомневалась в целесообразности своей поездки в Баку, так как в стране своеобразно трактуют права человека. В итоге ее убедили поехать, так как конференция IGF могла бы стать катализатором изменений в стране. Кроме того, президент Азербайджана пообещал Еврокомиссару встречу с политическими заключенными.

Нелли Кроес.

IGF – это огромный семинар, который поддерживает ЕС. Во время встречи обсуждают будущее интернет-политики, технологий и другие вопросы связанные с безопасностью во всемирной сети. Вопреки заверениям президента, Кроес так и не встретилась с заключенными во время своего визита в страну. К тому же она сказала, что на интернет-конференции угрожали активистам, а у советников взломали ноутбуки. «Никакой открытости», – сетует управляющий.

Хакерская атака на два ноутбука, принадлежащую помощникам Кроес, произошла в то время, когда  компьютеры находились в отеле Баку. Об этом сообщил пресс-секретарь Европейской Комиссии Райан Хирс.

«Предполагаю, что это была какая-то слежка», – заявил Хирс в интервью AP. «Компьютеры пройдут через судебную экспертизу, чтобы выяснить, какую информацию из них могли похитить».

Хирс благоразумно отказывается комментировать, кто же именно мог стоять за этими атаками.

Представитель президента Азербайджана заявил, что местные правоохранительные органы, а также руководство отеля, где останавливалась госпожа Хирс со свитой, «решает вопрос». Пока власти не обнаружили никаких фактов, которые бы свидетельствовали о взломе.

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru