Технологии ABBYY помогут SECURIT DLP распознавать конфиденциальные данные в графических документах

Технологии ABBYY помогут SECURIT DLP распознавать конфиденциальные данные в графических документах

Компания SECURIT, объявляет о заключении партнерского соглашения с компанией ABBYY. В рамках соглашения SECURIT сможет использовать технологию распознавания текстов ABBYY в продуктах Zlock и Zgate. Решения Zlock и Zgate, входящие в комплекс SECURIT DLP, предназначены для защиты от утечек конфиденциальной информации и персональных данных. Zlock и Zgate анализируют все выходящие за пределы корпоративной сети документы и блокируют их передачу в случае выявления нарушений действующих политик безопасности. 



Интеграция с ABBYY FineReader Engine позволит DLP-решениям SECURIT распознавать и предотвращать утечки конфиденциальных данных, содержащихся в отсканированных, рукописных и других графических документах. Для анализа распознанных текстов может использоваться более десяти технологий SECURIT. Среди них простая и эффективная технология «цифровых отпечатков» DocuPrints, лингвистический движок MorphoLogic для анализа динамических и недавно созданных документов и интеллектуальная технология SmartID с возможностью «обучения» в процессе своей работы. Для обнаружения конфиденциальной информации методом регулярных выражений в системе имеется более 50 предустановленных шаблонов персональных данных.

ABBYY FineReader Engine поддерживает распознавание текстов на 198 языках, в том числе на английском, белорусском, испанском, итальянском, казахском, китайском, немецком, русском, украинском, французском и японском. Высокие качество и скорость распознавания обеспечиваются применением собственных технологий предварительной подготовки документа — перед распознаванием происходит разделение текста и фона, исправляются возможные перекосы и «перевернутые» на 90 или 180 градусов страницы, корректируется масштаб, удаляются артефакты и искажения, обычно возникающие при сканировании или фотосъемке. ABBYY FineReader Engine поддерживает распознавание текста в BMP, DJVU, GIF, JPEG, PDF, PNG, TIFF и других распространенных форматах.

«Мы выбрали ABBYY, так как привыкли работать с лидерами в своих областях. Инструментарий для разработчика ABBYY FineReader Engine является лучшим решением для распознавания текстов и поддерживает множество языков, форматов файлов и дополнительных технологий, его использование существенно расширяет возможности наших DLP-решений. Кроме того, нас приятно удивила стабильность и скорость ABBYY SDK по сравнению с другими OCR-продуктами», — заявил Алексей Раевский, генеральный директор компании SECURIT.

«Системы защиты конфиденциальных данных от утечек должны поддерживать анализ потоков информации любого формата. В реальности, к сожалению, пока далеко не все DLP-системы способны предотвращать утечку конфиденциальных документов в графическом виде (сканы документов в pdf и других форматах, снимки экранов). Мы рады, что технологии распознавания ABBYY в составе продуктов SECURIT смогут сделать графические документы "видимыми" для процесса автоматического контроля и позволят еще более эффективно решать задачу защиты от утечек», — сказал Дмитрий Шушкин, директор по корпоративным проектам компании ABBYY Россия.

Атакующие прячут зловред в эмодзи и обходят ИИ-фильтры

Киберпреступники стали чаще использовать эмодзи и другие особенности Unicode, чтобы прятать вредоносный код, обходить фильтры и ускользать даже от ИИ-защиты. Новый тренд уже получил название emoji smuggling — «контрабанда через эмодзи».

Суть проста: злоумышленники кодируют команды и данные в символах, которые выглядят безобидно.

Это могут быть эмодзи, похожие друг на друга буквы из разных алфавитов (гомоглифы), невидимые символы Unicode или специальные знаки, меняющие порядок отображения текста. В итоге человек видит одно, а система обрабатывает совсем другое.

Один из популярных приёмов — подмена символов в доменах. Например, «apple.com» можно зарегистрировать с кириллическими буквами, которые визуально почти не отличаются от латиницы. В браузере адрес выглядит привычно, но ведёт на фишинговую страницу. Такие IDN-гомографические атаки известны давно, но сейчас они становятся частью более сложных схем.

Другой класс трюков — невидимые символы вроде Zero Width Space (U+200B). Они не отображаются на экране, но меняют структуру строки. Это позволяет «сломать» простые сигнатурные фильтры и при этом сохранить работоспособность кода. Исследователи уже показали инструменты, с помощью которых можно спрятать целый JavaScript-модуль в «пустом» файле за счёт нулевой ширины символов.

Отдельная тема — использование эмодзи как контейнера для данных. За счёт особенностей Unicode, тегов и вариационных селекторов можно зашифровать команды внутри последовательности иконок. Для логов и систем мониторинга это выглядит как обычные смайлики, но специальный декодер превращает их, например, в инструкции «скачать», «удалить», «выполнить».

Особенно тревожит исследователей влияние таких техник на ИИ-системы. По данным Mindgard, FireTail и других компаний, Unicode-манипуляции и «эмодзи-контрабанда» позволяют обходить фильтры безопасности LLM почти со 100-процентной эффективностью. Скрытая нагрузка может активироваться после простой расшифровки внутри модели, даже если видимый текст выглядит безобидно.

Проблема в том, что полностью запретить Unicode невозможно: бизнес глобален, пользователи пишут на разных языках, а эмодзи стали частью повседневного общения. Поэтому эксперты рекомендуют не блокировать символы, а внедрять более глубокую нормализацию и проверку входных данных.

RSS: Новости на портале Anti-Malware.ru