Россия – мировой лидер по распространению спама

Россия – мировой лидер по распространению спама

...

Корпорация Symantec опубликовала очередной аналитический отчет «May 2011 MessageLabs Intelligence Report». Согласно отчету, Россия вырвалась в мировые лидеры по доле рассылаемого спама. Кроме того, впервые за всю историю наблюдений спамеры начали запускать фальшивые сервисы для сокращения URL-адресов, чтобы осуществлять их переадресацию. Все они используют доменные имена в зоне .ru.



Согласно новой схеме, ссылки, созданные с помощью фальшивых сайтов для сокращения URL-адресов, не включаются в письма электронной почты напрямую. Вместо этого спам-рассылки содержат сокращенные URL-адреса, сделанные на других легитимных сайтах. Те, в свою очередь, ведут на сокращенный URL, созданный с помощью фальшивого сайта, который перенаправляет пользователя на собственный веб-сайт спамера. Такая схема позволяет оставаться незамеченными для многих спам-фильтров.

Аналитическая служба MessageLabs выявила сразу несколько фальшивых веб-сайтов, выполняющих сокращение URL-адресов, причем эти сайты связаны с одними и теми же спамерами, а также работают по одному и тому же принципу. Все они используют доменные имена в зоне .ru, а многие используют хостинг в России и Украине. Этот новый вид деятельности спамеров внес ощутимый вклад в прирост объемов спама на 2,9 %.

Интересно, что эти новые домены зарегистрированы за несколько месяцев до начала использования - вполне возможно, это еще один способ избежать разоблачения со стороны легитимных сервисов сокращения URL-адресов, поскольку возраст домена может использоваться как индикатор легитимности - подлинному сервису сокращения адресов будет гораздо труднее выявить потенциальные нарушения.

“В то время как легитимные сервисы сокращения URL-адресов стараются все более серьезно бороться со злоупотреблениями, спамеры, похоже, экспериментируют с методами запуска собственных аналогичных сервисов, чтобы лучше избегать перебоев в своей работе, – считает Пол Вуд (Paul Wood), старший аналитик MessageLabs, - Поскольку создаются все новые сервисы сокращения URL-адресов, мы ожидаем, что спамеры продолжат использовать их в своих вредоносных целях”.

Специалисты службы MessageLabs Intelligence уже несколько лет отслеживают, как спамеры злоупотребляют сервисами сокращения URL-адресов: злоумышленники используют самые разные сервисы этой категории, за короткий промежуток времени создавая на одном сайте тысячи ссылок. Применяя вышеупомянутый метод запуска собственных веб-сайтов, спамеры так же часто создают многозвенные проработанные "цепочки", в которых один сокращенный URL-адрес указывает на другой URL-адрес с другого сайта сокращения URL-адресов.

Иногда это повторяется более десяти раз, пока ссылка не приведет на сайт спамера. Особый рост такого кибермошенничества был зафиксирован в конце 2010 г., зато теперь использование подобных сервисов снизилось - как показывает апрельский отчет MessageLabs, злоумышленники переключились на спам в социальных сетях. Однако последние недели наблюдения показали возврат к спаму в электронной почте, что сказалось на увеличении объемов спама в целом.

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru