SkyDNS обновил базу категорированных интернет-ресурсов

SkyDNS обновил базу категорированных интернет-ресурсов

SkyDNS обновил базу категорированных интернет-ресурсов

Компания SkyDNS вывела свою базу категорированных ресурсов, SkyDNS DB, на новый более высокий уровень. Благодаря многолетней подготовительной работе компания в январе увеличила размер базы с 11 млн до 90 млн ресурсов, повысив качество их категоризации. Также важно отметить, что в SkyDNS DB содержатся как записи о сайтах, так и об отдельных веб-страницах. 

Это значительно повышает ценность базы категорированных ресурсов для целевой аудитории - разработчиков ПО и производителей сетевого оборудования, чьи продукты частично или полностью построены на классификации веб-сайтов. 

Точность базы достигается за счет сбора данных в интернете фермой краулеров и автоматической классификации этих данных собственными технологиям категоризации сайтов и выявления вредоносных ресурсов на базе технологий машинного обучения, искусственного интеллекта и анализа пользовательского поведения. 

SkyDNS DB предназначена для интеграции в продукты сторонних разработчиков программных и аппаратных систем: систем информационной безопасности, антивирусов, систем родительского контроля, файрволов, DLP-систем, интернет-шлюзов, систем онлайн-рекламы, SOC и CERT центров и т.п.

База доступна разработчикам как в стандартном виде с базовым числом категорий интернет-ресурсов, так и с более детальной категоризацией исходя из специфических нужд разработчиков. 

База категорированных интернет-ресурсов SkyDNS фактически является единственной в России доступной для коммерческого использования сторонними разработчиками и первой, внесенной в реестр российского ПО. Кроме того, по результатам прошлого года SkyDNS DB вошла в новый список лучшего отечественного ПО Best Soft, ежегодно составляемый изданием PC Magazine RU. 

Новая версия базы уже используется рядом отечественных разработчиков, в частности она встроена в интернет-шлюзы ИКС сервер, Ideco ICS, и другие программные и аппаратные продукты. 

Создание и развитие коммерческой базы категорированных ресурсов является одним из ключевых направлений стратегии развития компании. SkyDNS DB - это результат огромной работы отдела перспективных разработок компании, проведенной в последние 4 года. Компания не останавливается на достигнутом результате, планируется дальнейшее развитие этого направления. 

Новый вектор ProAttack позволяет незаметно внедрять бэкдоры в LLM

Промпт-инжиниринг давно стал нормой при работе с большими языковыми моделями. Но, как выясняется, вместе с удобством он приносит и новую поверхность атаки. Исследователи представили вектор под названием ProAttack, который позволяет внедрять бэкдор в модель через промпты, причём делать это почти незаметно.

В тестах атака показывала эффективность, близкую к 100%, причём без классических красных флагов вроде странных токенов или подмены меток.

В обычных атаках на NLP-модели злоумышленники добавляют в данные подозрительные слова или фразы и меняют метки. Такие вещи уже научились отслеживать. 

ProAttack идёт другим путём. Вместо явных «триггеров» он использует разные промпты для обучающих данных:

  • для части данных (целевая категория) — вредоносный промпт;
  • для остальных — обычный, чистый.

 

При этом сами тексты выглядят нормально, а метки остаются корректными. В итоге модель учится ассоциировать конкретный промпт с нужным злоумышленнику результатом.

А дальше всё просто: на этапе использования достаточно подать вход с этим промптом, и бэкдор срабатывает.

Особенно опасно, что атака остаётся эффективной даже при небольшом количестве данных. В ряде случаев хватало буквально нескольких (около шести) «отравленных» примеров, чтобы внедрить бэкдор.

Метод протестировали на разных задачах, включая даже медицинские сценарии (например, суммаризацию радиологических отчётов). И там он тоже показал высокую эффективность, практически не ухудшая качество работы модели.

Исследователи проверили ProAttack против популярных методов защиты — ONION, SCPD, back-translation и fine-pruning. Ни один из них не смог полностью остановить атаку.

В качестве возможного решения предлагается использовать LoRA (parameter-efficient fine-tuning). Идея в том, что такие методы ограничивают количество параметров, которые модель может менять при дообучении. А значит, ей сложнее запомнить связь между триггером и целевым результатом.

RSS: Новости на портале Anti-Malware.ru