Почти 80% родителей не интересуются поведением подростков в интернете

Почти 80% родителей не интересуются поведением подростков в интернете

Около 79% подростков 16-17 лет не получают рекомендаций от взрослых насчет того, какие сайты можно посещать в сети, сообщается в исследовании, проведенном Лигой безопасного интернета, МТС и «Лабораторией Касперского».

В исследовании приняли участие около 10 тысяч человек в возрасте от 6 до 17 лет из всех федеральных округов России. По итогам опроса 58,3% детей от 6 до 17 лет ответили, что они «беспрепятственно посещают любые сайты, которые им нравятся». Этот показатель зависит от возраста респондентов: в группе 6-7-летних о бесконтрольном пользовании интернетом заявили только 20% человек, в группе 16-17-летних — 78,4%.

К ответу «Родители сказали мне, на какие сайты можно заходить, а на какие — нельзя» присоединились 21,5% подростков. Заходить в интернет только в присутствии взрослых разрешают 9% респондентов. Родительский запрет на пользование интернетом действует для 3,2% опрошенных детей, сообщает digit.ru.

Среди опрошенных детей 72,2% считают себя активными пользователями сети. В виртуальное пространство они выходят преимущественно дома. Дети 6-7 лет «подолгу сидят в интернете» только в 17,5% случаев. В группе подростков 16-17 лет о длительности посещений интернета заявила почти половина респондентов. В основном несовершеннолетние выходят в сеть из своего дома — 82,6%. Вторым местом выхода в интернет является школа — 32,1%. Дети посещают различные сайты как во время уроков информатики — в 19,1%, так и после уроков — в 10,2%.

Большинство подростков для выхода в сеть используют личный стационарный компьютер или ноутбук — 54,6%. Около 40% пользуются мобильными телефонами и смартфонами.

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru