Symantec анонсировала самообучающуюся DLP-систему

Symantec анонсировала самообучающуюся DLP-систему

В первом полугодии наступающего года на рынок выйдет продукт Symantec Data Loss Prevention 11. Одной из его ключевых особенностей будет т.н. технология целенаправленного самообучения, которая призвана упростить обработку и классификацию важных сведений.



В Symantec уверены, что новая технология представляет собой значительный шаг вперед в сравнении с существующими методами определения тайной информации. Напомним, что это довольно важно для систем предотвращения утечек данных, поскольку им нужно уметь отличать конфиденциальную информацию от обычной. В какой-то степени технологию целенаправленного самообучения (ТЦС) можно назвать средством разработки политик безопасности, которые определяют подлежащие защите сведения.


Принцип работы самообучающейся системы, использованный Symantec, неплохо известен: он нередко применяется, скажем, при создании спам-фильтров. Суть его в том, что программное обеспечение учится определять информацию того или иного рода, сравнивая предложенные ему 'правильные' и 'неправильные' образцы данных. Ведущий менеджер Symantec по маркетинговой политике Роберт Хэмилтон разъяснил сущность этого принципа следующим образом:


"Допустим, разработчик программного обеспечения хочет защитить написанные им исходные коды для какого-либо приложения от утечки посредством электронной почты или съемных носителей. В то же время ему требуется, чтобы DLP-система не оказывала воздействия на передачу некоторых иных участков кода - положим, они относятся к типу open source, в силу чего являются общедоступными, и охранять их бессмысленно. Тогда он вводит в систему образцы своего кода как "правильные" примеры, а экземпляры открытых исходников - как "неправильные". Изучив их, ТЦС сформирует нужный профиль и настроит политику безопасности."


Аналитики отмечают, что в перспективе такая DLP-система сможет автоматически создавать политики для различных документов и прочих сведений. В целом предложенный Symantec подход может сделать защиту от утечек более гибкой и эффективной.


Помимо ТЦС, в продукте Data Loss Prevention 11 можно будет увидеть и иные нововведения. В частности, в его состав войдут средство контроля доступа приложений к файлам (оно позволит удостовериться, что сторонние программы вроде iTunes или Skype не передают за пределы корпоративного брандмауэра важные сведения), функционал под названием FlexResponse, обеспечивающий взаимодействие с клиентскими средствами защиты от других производителей, подсистема Risk Scoring, осуществляющая приоритезацию информационных активов в зависимости от степени важности данных и количества пользователей, авторизованных для работы с ними.


Подробная информация (на английском языке) изложена в пресс-релизе Symantec.

Атакующие прячут зловред в эмодзи и обходят ИИ-фильтры

Киберпреступники стали чаще использовать эмодзи и другие особенности Unicode, чтобы прятать вредоносный код, обходить фильтры и ускользать даже от ИИ-защиты. Новый тренд уже получил название emoji smuggling — «контрабанда через эмодзи».

Суть проста: злоумышленники кодируют команды и данные в символах, которые выглядят безобидно.

Это могут быть эмодзи, похожие друг на друга буквы из разных алфавитов (гомоглифы), невидимые символы Unicode или специальные знаки, меняющие порядок отображения текста. В итоге человек видит одно, а система обрабатывает совсем другое.

Один из популярных приёмов — подмена символов в доменах. Например, «apple.com» можно зарегистрировать с кириллическими буквами, которые визуально почти не отличаются от латиницы. В браузере адрес выглядит привычно, но ведёт на фишинговую страницу. Такие IDN-гомографические атаки известны давно, но сейчас они становятся частью более сложных схем.

Другой класс трюков — невидимые символы вроде Zero Width Space (U+200B). Они не отображаются на экране, но меняют структуру строки. Это позволяет «сломать» простые сигнатурные фильтры и при этом сохранить работоспособность кода. Исследователи уже показали инструменты, с помощью которых можно спрятать целый JavaScript-модуль в «пустом» файле за счёт нулевой ширины символов.

Отдельная тема — использование эмодзи как контейнера для данных. За счёт особенностей Unicode, тегов и вариационных селекторов можно зашифровать команды внутри последовательности иконок. Для логов и систем мониторинга это выглядит как обычные смайлики, но специальный декодер превращает их, например, в инструкции «скачать», «удалить», «выполнить».

Особенно тревожит исследователей влияние таких техник на ИИ-системы. По данным Mindgard, FireTail и других компаний, Unicode-манипуляции и «эмодзи-контрабанда» позволяют обходить фильтры безопасности LLM почти со 100-процентной эффективностью. Скрытая нагрузка может активироваться после простой расшифровки внутри модели, даже если видимый текст выглядит безобидно.

Проблема в том, что полностью запретить Unicode невозможно: бизнес глобален, пользователи пишут на разных языках, а эмодзи стали частью повседневного общения. Поэтому эксперты рекомендуют не блокировать символы, а внедрять более глубокую нормализацию и проверку входных данных.

RSS: Новости на портале Anti-Malware.ru