Доля спама в ноябре сократилась до 62,2%

Доля спама в ноябре сократилась до 62,2%

По оценке Symantec, в минувшем месяце мусорная составляющая почтовой корреспонденции сократилась на 5,5 процентных пункта – до 62,2%. Наиболее высокие уровни спама наблюдались в Шри-Ланке (77,5%), а в разделении по областям хозяйственной деятельности – в сфере образования (63,6%).



Непочетный пьедестал списка стран-источников почтового мусора по итогам ноября разделили США, Бразилия и Россия (8,7%; 6,4% и 6,2% спама соответственно). В тематическом составе ноябрьского спама преобладали реклама порносайтов и предложения знакомств (совокупно 71,2% нелегитимных писем). Эта объединенная категория уверенно опережала предложения трудоустройства (16,5%) и рекламу фармацевтических изделий (8,8%).

Статистику по размерам нелегитимных писем и TLD-доменам, обнаруженным в ссылках спамеров, Symantec представила с отставанием в 1 месяц. Согласно данным компании, доля коротких, до 5 КБ, сообщений в октябре заметно увеличилась – до 40,2% против 19,6% в предыдущем месяце. Октябрьский рейтинг используемых спамерами TLD возглавил .com (26,1% URL), а прежний лидер .ru выбыл из этого непочетного списка.

Уровень фишинга в электронной почте продолжает снижаться. В ноябре фишинговым было 1 письмо из 1311 против 1 из 1135 в октябре. Наиболее высокие концентрации фишинговых сообщений наблюдалось в госсекторе (1 на 435), а среди регионов – в Южной Африке (1 письмо на 486). Основными источники фишинговых сообщений стали США (31,7% общего объема) и Великобритания (16,2%). Более половины (52,4%) сайтов-ловушек, обнаруженных экспертами за отчетный период, были созданы автоматизированными средствами. 74,8% фишинговых сайтов имитировали ресурсы финансовых институтов, 20,3% – информационные веб-сервисы.

Концентрация писем с вредоносными вложениями в почтовой корреспонденции, напротив, увеличилась. В ноябре опасным было 1 письмо из 235, тогда как в предыдущем месяце – 1 из 437. Это самый высокий показатель за истекшие 12 месяцев. Наиболее атакуемой сферой в этом отношении вновь оказался госсектор (1 письмо на 62), а в разделении по странам – Великобритания (1 на 109). Эта же страна лидирует и по объемам зараженного спама (54,9% общего количества), уверенно обгоняя США (15,3%).

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru