79% родителей хотели бы обезопасить своих детей в Сети с помощью специальных защитных решений

79% родителей хотели бы обезопасить своих детей в интернете

Когда речь заходит о детях в Интернете, то всеобщая доступность Сети превращается в источник не только полезной информации и развлечений, но и угроз об этом свидетельствуют результаты исследования, проведенного «Лабораторией Касперского» совместно с аналитическим агентством B2B International.

 

Более трети (36%) российских родителей признают, что их дети подвергались риску в Сети. Из них 20% сталкивались с нежелательным контентом, а 5% вступали в переписку с незнакомцами. В целом 79% взрослых согласились с тем, что эффективные средства для защиты детей в Интернете были бы очень полезны и востребованы ими. Однако, как показали результаты исследования, использовать их мамы и папы не спешат: каждый пятый родитель в России не предпринимает никаких действий для того, чтобы обезопасить своего ребенка в Интернете. Помимо этого, 18% регулярно разрешают детям пользоваться своим смартфоном или планшетом без присмотра за этим процессом.

Те взрослые, которые все же решили обезопасить своего ребенка, выбирают различные методы защиты. Так, 39% родителей ограничивают время, которое дети проводят в Интернете, а 30% регулярно проверяют историю браузера. При этом лишь 26% используют защитное ПО с функциями родительского контроля. Многие даже не подозревают, что неконтролируемый серфинг в Сети может иметь множество последствий, которые не ограничиваются банальным заражением используемого устройства зловредами. Например, ребенок может оплатить услуги с помощью кредитной карты родителей или удалить рабочие документы.

«Не имея достаточного опыта работы с компьютерами и мобильными устройствами, дети ненамеренно совершают ошибки, за которые часто приходится платить родителям. 17% опрошенных мам и пап в России понесли финансовые убытки, либо потеряли важные данные из-за действий ребенка. В основном, дети случайно удаляли важные сведения и без спроса пользовались платежными средствами», —говорит Константин Игнатьев, руководитель группы анализа веб-контента «Лаборатории Касперского».

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru