В Санкт-Петербурге задержан автор "нигерийских писем"

В Санкт-Петербурге задержан автор "нигерийских писем"

...

В Санкт-Петербурге задержан автор писем о получении огромного наследства от жителей Африки, известных как "нигерийские письма". Их автором оказался гражданин Нигерии, сообщает пресс-служба городского ГУ МВД.



Задержание произошло по заявлению одной из жертв мошенника. Женщина, получив электронное письмо о получении ею наследства в республике Того, перевела на счета троих иностранных граждан 2,56 тысячи долларов США. Одним из получателей был как раз гражданин Нигерии, пишет rbc.ru.

Следствие предполагает, что мошенник также является косвенным виновником убийства. Супружеская пара, получившая подобное письмо, перечислила на счет неизвестного 100 тыс. долл. Когда обман раскрылся, между супругами произошел конфликт, в результате которого женщина нанесла мужу смертельное ножевое ранение.

Против нигерийца возбуждено уголовное дело по ст.159 Уголовного кодекса. Ведется расследование.

"Нигерийское письмо" – распространенный вид мошенничества. В нем получателю письма рассказывается о том, что отправитель располагает миллионами долларов, которые либо получены нелегальным путем, либо являются наследством, оставленным после трагической смерти некоего весьма состоятельного господина, гражданина одной из африканских стран.

Спамер сообщает, что деньги в настоящее время не могут быть обналичены законным путем, поскольку в стране произошел переворот и осуществление всех финансовых операций затруднено, либо у "погибшего" не осталось родственников, которые могли бы на легальных основаниях вступить в наследство. В связи с этим получателя "нигерийского письма" просят сообщить реквизиты его банковского счета с тем, чтобы перевести эти деньги за границу. За участие в этой операции владельцу счета предлагается солидное вознаграждение - от 10% до 40% от указанной суммы. Но, получив доступ к банковскому счету жертвы, мошенники быстро опустошают его и прекращают контакт со своим "клиентом".

Письма называются "нигерийскими", поскольку считается, что данный вид мошенничества родом из Нигерии. Причем изначально мошенники пользовались обычной почтой.

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru