Правообладатели приступили к заполнению реестра пиратских сайтов

Правообладатели приступили к заполнению реестра пиратских сайтов

Правообладатели приступили к заполнению реестра пиратских сайтов

В России начали создавать базу данных пиратских ссылок после подписания антипиратского меморандума. По словам Дмитрия Чернышенко, главы «Газпром-медиа», заполнением баз данных занялись сами правообладатели.

Напомним, что 1 ноября Роскомнадзор организовал церемонию подписания антипиратского меморандума между правообладателями и интернет-площадками. Среди приглашенных были представители таких серьезных компаний, как Mail.ru Group, Rambler, Rutube и «Яндекс».

Согласно меморандуму, требуется создать реестр ссылок с нелегальным контентом. Также документ призван обеспечить досудебное взаимодействие между правообладателями и интернет-площадками. Обязанности по ведению такого реестра возложат на Роскомнадзор. Помимо этого, ведомство также выступит посредником в переговорах участников соглашения.

Чернышенко отметил, что реестр в том виде, которое предусматривает меморандум, будет готов на ранее, чем через три месяца.

«Я знаю, что вовсю работают те, кто создают эту платформу. И начинается уже предварительное заполнение базы данных», — передал ТАСС слова главы «Газпром-медиа».

Правообладатели не зря обеспокоились проблемой пиратов. В прошлом месяце Group-IB проанализировала активность пиратов на просторах Сети. Оказалось, что за 2018 год пираты значительно увеличили эффективность своей «работы» — лишь за те девять месяцев, что уже прошли, пиратам удалось выпустить больше нелегальных копий фильмов, чем суммарно за прошлый и 2016 год. Доходы от такой деятельности достигли 85 миллионов долларов, они продолжают расти.

В прошлом году пираты сняли 211 копий фильмов, вышедших в российский прокат, при этом всего их было 477. За 2016 год таких фильмов было всего 33.

За те 9 месяцев, которые прошли с начала 2018 года, количество нелегальных копий достигло 280 — это приблизительно 80 % всех вышедших в прокат фильмов, говорят в Group-IB.

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru