DarkMind: специалисты продемонстрировали манипулятивную атаку на LLM

DarkMind: специалисты продемонстрировали манипулятивную атаку на LLM

DarkMind: специалисты продемонстрировали манипулятивную атаку на LLM

Исследователи из Университета Сент-Луиса продемонстрировали атаку на большие языковые модели (LLM), позволяющую манипулировать процессами рассуждения нейросетей. В отличие от других методов атак на искусственный интеллект, эта уязвимость не обнаруживается стандартными средствами и не требует изменения запросов.

Авторы исследования, Зен Го и Реза Турани, назвали свою разработку DarkMind. Техника базируется на уязвимостях парадигмы «цепочки рассуждений» (Chain-of-Thought, CoT), используемой в таких моделях, как ChatGPT, GPT-4, O1 и LLaMA-3.

DarkMind внедряет скрытые триггеры в приложения, работающие поверх языковых моделей, что делает атаку практически незаметной при обычном использовании. Выявить её сложно даже в приложениях, которых уже насчитывается сотни тысяч, так как она активируется только при срабатывании определенных шаблонов рассуждений.

При этом меры защиты, предназначенные для противодействия другим типам манипулятивных атак, не обнаруживают DarkMind, и вредоносная активность выявляется лишь после её активации.

Исследователи также установили, что чем совершеннее LLM, тем более они уязвимы к данной технике атак. Более того, для её применения не требуется модификация запросов или алгоритмов работы моделей, что делает технологию простой в использовании и потенциально массовой, особенно в таких секторах, как финансы и медицина, где LLM активно внедряются.

Зен Го и Реза Турани сообщили, что работают над защитными мерами, направленными на предотвращение подобных атак, и призвали разработчиков усилить встроенные механизмы защиты от манипулятивных воздействий на LLM. Однако, по мнению Microsoft, создать полностью безопасные системы на базе генеративного ИИ невозможно.

Windows 11 получит аналог Handoff: продолжение задач с Android

Windows 11 всё ближе подбирается к идее реализовать аналог Handoff в связке с Android-смартфонами. Microsoft готовит расширенную функциональность cross-device resume, которая позволяет переносить работу с Android-смартфона прямо на компьютер. Если раньше Windows 11 умела подхватывать в основном сеансы OneDrive, то теперь список заметно расширяется.

В свежем обновлении для канала Release Preview, которое начало распространяться на этой неделе, появилась возможность продолжать:

  • воспроизведение Spotify с телефона на десктопе,
  • работу с документами Word, Excel и PowerPoint,
  • сессию просмотра в Edge — ровно с той же вкладки, где вы остановились на смартфоне.

По сути, это аналог Handoff в экосистеме Apple, где задачи можно без швов переносить между iPhone, iPad и macOS. Microsoft впервые рассказала о таком сценарии для Windows 11 ещё на конференции Build в прошлом году.

Ранее похожая идея уже существовала в Windows 10 под кодовым названием Project Rome, но тогда разработчики её почти не поддержали.

Визуально это реализовано просто: Windows 11 предлагает продолжить активность, начатую на телефоне, — например, одним кликом возобновить проигрывание трека в Spotify или открыть документ, над которым вы работали.

RSS: Новости на портале Anti-Malware.ru