G Data предупреждает об очередной волне спама в День смеха

G Data предупреждает об очередной волне спама в День смеха

В День смеха (1 апреля) во всем мире принято подшучивать над родственниками, друзьями и коллегами. Тем временем киберпреступники также не теряют бдительность и используют любую возможность для распространения вредоносного кода. Специалисты G Data Software ожидают очередной сезонный всплеск рассылки спам-сообщений о Дне дурака с предложениями загрузить «интересное» ПО для розыгрыша друзей и близких, которое на практике загружает только вирусы. Вместе с привычными спам-сообщениями зловредописатели распространяю вредоносный код в социальных сетях, размещая на стене или в личных сообщениях ссылки на видео с первоапрельскими шалостями, розыгрышами и праздничными открытками.



«1 апреля уже давно стал красным днем календаря для любого киберпреступника. Еще в недавнем прошлом темой письма в зараженных сообщениях была «1 Апреля – никому не верь!», «День дурака» и прочее. Сегодня они становятся более привлекательными для любопытного пользователя — «100 и 1 способ разыграть своих близких», «Розыгрыши на 1 апреля» и прочее. Такие виды поздравлений должны быть немедленно удалены с компьютер, особенно если имя отправителя вам неизвестно. Мы советуем пользователю не нажимать на какие-либо содержащиеся в подобных сообщениях ссылки, так как они зачастую автоматически загружают вирусы на ваш компьютер, — рассказывает Ральф Бенцмюллер, руководитель лаборатории безопасности компании G Data Software».

Советы от экспертов лаборатории G Data Software:

  • Неизвестный отправитель. Ни в коем случае не открывайте письма от неизвестных отправителей. И не нажимайте на какие-либо прикрепленные к ним ссылки или файлы. 
  • Социальные сети. Киберпреступники выигрывают за счет любопытства пользователей, поэтому также будьте осторожны в социальных сетях. Не нажимайте на подозрительные и особенно сокращенные ссылки. Зачастую за ними находятся опасные ссылки на вредоносные сайты и файлы. 
  • Грамматические ошибки. Выявить уловку преступникам можно языку сообщения. Если сообщение от незнакомого человека или даже друга содержат глупые грамматические и орфографические ошибки, а также, если по тексту видно, что он бы переведен на русский язык в электронном переводчике, то лучше удалить такое сообщение, не читая.  
  • Обновление антивируса. Регулярно загружайте все обновления для вашего антивирусного решения, так как специалисты исследовательских лабораторий вендров, работающих в области информационной безопасности, в режиме реального времени разрабатывают патчи, которые автоматически закрывают лазейки в системе. 
  • Атаки спама. Удаляйте спам сообщения! Ни при каких обстоятельствах не отвечайте на сообщения, не подтверждайте получение письма и не пытайтесь отписаться от рассылки. Любой ответ расценивается как подтверждение активности почтового ящика. В противном случае объем спама может увеличиться в несколько десятков и даже сотен раз.  

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru