Хакеры спровоцировали скандал в Великобритании

Хакеры спровоцировали скандал в Великобритании

В Великобритании на днях разразился скандал, связанный с разглашением секретной информации. Этот скандал, как сообщает ХАКЕР.ру, продемонстрировал не только, как политики всех мастей используют деньги налогоплательщиков на обустройство своей личной жизни, но и изрядную небрежность, с которой важные документы могут храниться на персональных компьютерах членов парламента и кабинета министров.

Источником информации для журналистов на этот раз послужила электронная почта и файлы с их машин, к которым кому-то удалось получить доступ. Украденную информацию злоумышленники попытались продать общенациональным газетам.

Удивляет то, насколько безответственно могут относиться к безопасности таких сведений политики и их советники, ведь уязвимость парламентских компьютеров для кибератак констатируется уже не в первый раз.

В марте были выявлены случаи заражения парламентских машин червем Conficker, а на прошлой неделе парламентарий Ник Харви сообщил, что подавляющее большинство из 5000 компьютеров британского парламента за прошедший год было заражено различными вирусами.

Зараженными оказались 86% машин, 78% из которых были автоматически очищены от него парламентскими антивирусными программами, однако 8% ПК до сих пор нуждаются в лечении.

Напомним, результаты журналистского расследования, которое касалось расходов парламентариев, опубликовала британская газета Daily Telegraph. Как утверждает газета, личные траты чиновники возмещали за счет государственной казны.

История вызвала огромный общественный резонанс, так как траты большинства депутатов оказались неоправданными - деньги налогоплательщиков шли на ремонт домов, бассейнов, покупку новой мебели и даже собачий корм и детские подгузники.

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru