В России создали Android-приложение, распознающее телефонного мошенника

В России создали Android-приложение, распознающее телефонного мошенника

В России создали Android-приложение, распознающее телефонного мошенника

Новое приложение, способное отличить телефонного мошенника в самом начале разговора и предупредить о потенциально опасном звонке пользователя, — разработка российских программистов. Основной целевой аудиторией этой системы являются клиенты кредитных организаций и пользователи банковских продуктов.

Всего девелоперы представили три компонента. Помимо вышеописанного противодействия телефонным мошенникам, разработчики предлагают аналогичный сервис для контроля переписки гражданина с мошенником в социальных сетях, а также функцию распознавания фишинговых сайтов.

Нынешние условия, в которых приходится мириться с растущей долей мошенничества среди всех киберпреступлений, давно требуют какого-нибудь радикального решения. Например, по словам зампреда правления Сбербанка Станислава Кузнецова, в 2020 доля телефонного мошенничества от всех киберпреступлений составила 97%.

На сегодняшний день наши разработчики предлагают Android-приложение, которое после установки на устройстве будет перехватывать все звонки. Записанный софтом разговор отправляется на сервер, а там уже аудио преобразуется в текст.

Далее в ход вступает искусственный интеллект, анализирующий полученный текст и тему разговора. Если в диалоге присутствуют семейные дела или, например, погода, алгоритмы прекращают анализ записи.

Если же собеседник упоминает банки, счета, финансовые институты, начинается более глубокий анализ. На этом этапе ИИ пробует найти признаки, характерные для общения с мошенником.

«Чтобы научить нейронную сеть отличать диалог со злоумышленником, мы взяли два типа разговоров — безобидные и мошеннические. Для добавления в базу последних мы находим злоумышленников в Сети и записываем общение с ними», — объяснил «Известиям» один из разработчиков системы.

Специалисты даже специально отбирают разные виды мошенничества и схемы беседы. Именно так нейронную сеть учат обращать внимание на определённые слова.

Эксперт GIS, заместитель генерального директора — технический директор компании «Газинформсервис» Николай Нашивочников прокомментировал новую российскую разработку для борьбы с киберпреступниками:

«Успешная реализация такой разработки потребует больших денег и по-хорошему более глубокой проработки сценариев использования и архитектуры.

В целом методы машинного обучения применяются для указанных задач почти 10 лет. Особых прорывов пока не было, хотя это, безусловно, перспективные технологии. Отмечу отличие от user behavior (поведенческой аналитики). Коллеги используют машинное обучение с учителем, т.е. "тренируют" машину на обучающих выборках эффективно относить текущий набор текстовых данных к одному из двух классов: нормальный или зловредный. В user behavior основная фича — в построении нормального (базового) профиля поведения сущности и оценки отклонения от него. Существенное отклонение от профиля помечается как потенциальная атака. При этом используют в основном машинное обучение без учителя».

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru