Хакеры угрожают подорвать АЭС в Южной Корее

Хакеры шантажируют южнокорейскую АЭС

Компания Korea Electric Power Corporation – оператор одной из южнокорейских АЭС – утверждает, что компьютерные системы станции взломали. Сотрудники учреждения беспокоятся о том, что целями атакующих может быть инфраструктура страны. Во взломе уже подозревают Северную Корею.

Проникновение привело к тревоге 22 декабря по атомным электростанциям Южной Кореи. Превентивную тренировку провели через несколько дней после того, как США обвинили Пхеньян во взломе кинокомпании Sony Pictures. Атака привела к тому, что компания отказалась от выпуска сатирической ленты «Интервью» (The Interview) о северокорейском диктаторе. Власти Северной Кореи отрицают какое-либо участие в происшествии и пригрозили ответом, если Белый Дом не прекратит обвинять страну.

В Сеуле утверждают, что в Сеть просочилась некритическая информация об атомных электростанциях. При этом чиновники уверены в том, что могут отразить атаки, которые способны навредить безопасности АЭС государства. Министерство энергетики и представители компании Korea Electric Power Corporation не сказали, замешан ли в происшествии северный сосед страны.

Новая утечка привела к тому, что персональные данные 10 тыс. компании появились в Сети. В сведения входят дизайны и инструкции как минимум к двум реакторам и подсчеты радиоактивного облучения, которые получат местные жители. При этом не существует доказательств того, что системы контроля АЭС взломали.

Korea Electric Power Corporation оперирует 23 ядерными реакторами, которые обеспечивают практически треть энергетических потребностей Южной Кореи. По словам представителей компании, они делают всё возможное и работают с правительством, чтобы дать оценку сливу информации, которая вызвала опасения в обществе.

21 декабря неизвестный хакер пригрозил опубликовать новые данные, если правительство не отключит три реактора к 25 числу. В сообщении местным жителям порекомендовали не приближаться к месторасположениям данных АЭС в ближайшие несколько месяцев. При этом в Сеуле не видят никакой возможной угрозы. По словам специалистов, хакер не может остановить работу атомной электростанции, ведь контрольная система полностью закрыта.

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru