В Китае обучение хакерству поставлено на поток

В Китае обучение хакерству поставлено на поток

Обучение хакеров практически превратилось в индустрию в Китае, которая ежегодно приносит 238 млн юаней доходов (около $34,8 млн).По всему Китаю открываются школы (в основном, виртуальные), где желающих обучают хакерскому искусству. При этом точное количество таких учебных заведений все еще неизвестно.

«Наша школа просто помогает обычным гражданам обучиться самообороне в киберпространстве, хотя курсы и называются «Основы хакерства», — рассказывает один из сотрудников пекинской школы hackerbase.com. По его словам, выпускникам курсов легко взламывать другие компьютеры, хотя их и предупреждают о недопустимости использования их навыков в незаконных целях: школа не несет никакой ответственности.

«На многих хакерских курсах учат, как взламывать незащищенные компьютеры и украсть персональные данные. Затем ученики зарабатывают деньги, продавая такую информацию, — говорит консультант по безопасности того же портала Вэнь Сяньбинь. — Хакерская школа немного похожа на автошколу: тебя учат водить, и тебе решать, ездить осторожно или задавить кого-то».

Двадцатипятилетний ученик одной из таких школ заявил, что большинство его «одноклассников» посещают такие курсы по личным причинам - для того, чтобы научиться шпионить за родственниками, похвастаться своими знаниями или отомстить какому-либо веб-сайту, а не для заработка денег на своих навыках. При этом экономический ущерб от действий хакеров в Китае в прошлом году оценивается в 7,6 млрд юаней ($1 млрд).

«Обучение других людей взлому чужих компьютеров определенно является преступлением», - сказал представитель одной из юридических фирм Пекина. По его мнению, все подобные школы нужно закрыть, а их владельцев отдать под суд.

источник

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru