мировые СМИ убеждены, что лучшие хакеры живут в РФ

Мировые СМИ убеждены, что лучшие хакеры живут в РФ

В любой непонятной ситуации во всём вините русских хакеров! Навязчивая идея прослеживается не только в новостях. Уже много лет чокнутые русские хакеры — излюбленный персонаж в Голливуде. Каким же образом российским хакерам удалось заработать такую репутацию?

«Российские хакеры уже превратились в бренд, как французские вина или швейцарские часы. Они, скорее, легенда, чем реальность», — говорит генеральный директор компании Zecurion Алексей Раевский.

И всё равно власти Великобритании запретили солдатам приносить на учения мобильные телефоны, опасаясь шпионажа со стороны России. Москву также обвиняют в совершении сложнейших киберопераций, сообщает russian.rt.com.

Кроме того, Россия является третьим по активности центром рассылки рекламных электронных писем — спама. С точки зрения опыта, страна имеет очень сильные традиции в сфере информационных технологий.

И хотя лучшие умы Кремниевой долины родом из России, когда речь заходит о киберпреступлениях, границы, по всей видимости, стираются.

«У современных кибепреступлений нет одной национальности, хакеры из разных стран работают сообща», — говорит старший антивирусный эксперт «Лаборатории Касперского» Сергей Ложкин.

Мир хакеров на самом деле многосторонний. Существуют так называемые белые шляпы — хакеры, которые не нарушают закон, а работают, чтобы сделать сеть безопаснее. Их заклятые враги — «чёрные шляпы», чьи злодейские поступки ради денег или дурной славы принесли хакерскому делу сомнительную репутацию. Однако далеко не все хакеры делятся на два цвета.

«Это моральный выбор каждого выпускника университета — приносить пользу или вред», — говорит Сергей Ложкин.

И хотя хакеры из России иногда и могут натворить дел, они не являются таинственной угрозой, как о них часто говорят.

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru