Атака на Web сайты с перенаправлением через поисковые системы

Атака на Web сайты с перенаправлением через поисковые системы

Неизвестные злоумышленники, воспользовавшись уязвимостью большого количества сайтов, включая сайт Microsoft.com, устанавливали пользователям вредоносное ПО.

Всего около недели тому в США было закрыто две компании, занимающиеся продажей поддельных антивирусных решений. Ровно столько времени понадобилось «новому игроку», чтобы завоевать рынок продаж поддельного антивирусного ПО. Злоумышленники использовали приемы SEO для размещения ссылок на загрузку поддельных антивирусных решений в поисковых системах. Для того, чтобы обмануть пользователей, в качестве «прокси» страниц использовались легитимные сайты, содержащие функционал перенаправлений. Злоумышленникам удалось разместить в поисковиках более миллиона ссылок на десятки тысяч поисковых фраз на сайты популярных online изданий, университетов и сайты microsoft.com и irs.gov.

Например, по запросу «Microsoft Office 2002 download» поисковик Google разместил на первое место ссылку на механизм перенаправления на сайте Microsoft. Пользователи, которые выбрали первую ссылку из результатов поиска, были перенаправлены на злонамеренный сайт, где злоумышленники пытались заставить пользователей скачать и установить поддельный антивирус.

Поддельное антивирусное ПО устанавливает на систему килогер для кражи учетных данных и сообщает о необходимости приобретения программного обеспечения System Security при посещении любого Web сайта.

В данный момент уязвимость на сайте microsoft.com устранена, но существует очень большое количество сайтов, которые смогут использовать злоумышленники для подобных атак.

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru