Лаборатория Касперского: Фишинг вышел за рамки почтовых рассылок

Лаборатория Касперского: Фишинг вышел за рамки почтовых рассылок

Лаборатория Касперского: Фишинг вышел за рамки почтовых рассылок

Эксперты «Лаборатории Касперского» рассказали о новых методах распространения фишинга и другого мошеннического контента — вся ситуация вышла за рамки почтовых рассылок. Одна из самых крупных массовых фишинговых кибератак в конце первого полугодия была зафиксирована в мессенджерах и социальных сетях. Причём пользователи, сами того не осознавая, активно «помогали» злоумышленникам, добровольно пересылая мошеннические сообщения своим друзьям.

По словам специалистов «Лаборатории Касперского», для распространения своего вредоносго контента мошенники всё чаще используют WhatsApp. В основном в их сообщениях речь идёт о несуществующих розыгрышах или выгодных предложениях.

К примеру, в прошедшем квартале в России злоумышленники активно эксплуатировали бренды популярных розничных сетей и, например, рестораны быстрого питания, предлагая различные бонусы от их имени. Для получения бонуса пользователю нужно было пройти простой опрос и отправить сообщение указанному количеству контактов в мессенджере.

Однако простой пересылкой сообщения дело не заканчивалось. После того как пользователь отправлял ссылку знакомым, его самого перенаправляли на другой ресурс, содержимое которого меняется в зависимости от местоположения жертвы или используемого устройства. Так, если пользователь заходит со смартфона, то его чаще всего автоматически подписывают на платные услуги.

Или же он может быть перенаправлен на страницу с опросом или лотереей, с помощью которых злоумышленники собирают персональные данные жертв. Ещё один вариант развития событий: пользователю предлагается установить расширение для браузера, которое впоследствии будет перехватывать все вводимые им данные.

В свою очередь, в популярной соцсети Twitter используется другая мошенническая схема: там злоумышленники создают поддельные аккаунты известных лиц и компаний и от их имени сообщают о якобы бесплатной раздаче криптомонет. Для получения «награды» нужно лишь перевести на указанный в сообщении адрес криптокошелька немного криптовалюты, а в ответ получить сумму, преумноженную в несколько раз.

Во втором квартале киберпреступники чаще всего прикрывались именами Илона Маска, Павла Дурова и Виталика Бутеритна. Эффективность таких схем повышается за счёт громких инфоповодов. К примеру, блокировка мессенджера Telegram породила целую волну поддельных сообщений от имени Павла Дурова о возмещении ущерба.

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru