Цифровые отпечатки спасают бизнес от утечек

Цифровые отпечатки спасают бизнес от утечек

Компания InfoWatch объявляет о выпуске осенью этого года нового модуля «Цифровые отпечатки» («Fingerprints»), позволяющего, в рамках решения по защите от утечки данных InfoWatch Traffic Monitor, снимать с конфиденциальных документов цифровые «слепки» и отслеживать по ним случаи несанкционированного использования «чувствительных» для компании данных.

«Цифровые отпечатки» могут сниматься с любых документов, которым внутри компании присвоена категория «конфиденциально»: устав компании, реестр держателей акций, финансовые документы, любые виды отчётов, маркетинговые материалы на этапе их разработки и т.д. По сути, такого рода документы существуют почти в каждой организации. В частности, использование этой технологии может оказаться полезным для компаний, работающих с персональными данными (медицина, банки, страховые компании т.п.) или обладающим ценной технологической информацией, потеря которой может нанести ущерб конкурентоспособности (ИТ, фармацевтика, строительные компании и т.п.)

Новая технология, интегрированная в InfoWatch Traffic Monitor, позволяет автоматически распознавать схожие документы с целью детектирования потенциально опасных операций с конфиденциальными данными.

Одним из преимуществ модуля «Цифровые отпечатки» является наличие в нём эталонной базы, формируемой на основании документов-образцов (эталонов), с которыми, сравниваются анализируемые файлы. В целях обеспечения информационной безопасности компании, эталоны перед помещением в базу, специальным образом преобразуются, что, в свою очередь, делает невозможным восстановление их исходного текста по информации, хранимой в эталонной базе. Таким образом, даже если злоумышленник получает доступ к базе, утечки конфиденциальных данных не происходит.

В анализируемом документе могут быть обнаружены как отдельные цитаты из эталонного файла, так и весь документ. Технология «Цифровые отпечатки» позволяет детектировать не только фрагменты документов, полностью совпадающие с эталонными, но и те, что содержат некоторые изменения в текстах документов-образцов.

В целях повышения качества анализа, в данной технологии реализованы компоненты лингвистической поддержки. В частности, цифровые отпечатки InfoWatch позволяют работать с многоязычными документами и использовать морфологическую обработку (как словарную, так и бессловарную) анализируемого текста.

«Интеграция модуля «Цифровые отпечатки» в InfoWatch Traffic Monitor является логическим продолжением стратегии нашей компании, заключающейся в постоянном совершенствовании и развитии своих решений, - комментирует директор по продуктам InfoWatch, Светлана Ашкинази. – Уверена, что данная инновация позволит значительно облегчить детектирование конфиденциальных документов при попытке их несанкционированного использования, что в свою очередь заметно повысит качество защиты предприятия от утечек чувствительной информации».

Разработка новосибирских ученых снизит галлюцинации ИИ

В Новосибирском государственном университете разработали библиотеку, которая повышает точность и надёжность ответов нейросетей и помогает снизить количество «выдуманных» или заведомо недостоверных ответов — так называемых ИИ-галлюцинаций. Решение получило название RAGU (Retrieval-Augmented Graph Utility) и основано на использовании графов знаний, отражающих связи между различными элементами информации.

Такие графы помогают нейросетям лучше понимать контекст запросов и выявлять неочевидные зависимости. В рамках проекта они были интегрированы с большими языковыми моделями, что позволило повысить качество генерации ответов.

«Саму концепцию придумали не мы. Архитектура GraphRAG была предложена в статье Microsoft, опубликованной около года назад. Идея оказалась удачной, но мы увидели ряд недостатков — в частности, очень долгий процесс построения графа знаний и недетерминированный результат. Наш подход позволил ускорить работу и повысить её надёжность», — рассказал научный сотрудник лаборатории прикладных цифровых технологий Международного научно-образовательного математического центра НГУ Иван Бондаренко.

В отличие от оригинального подхода Microsoft, новосибирские исследователи применили многошаговый метод формирования графа знаний. Это позволило существенно ускорить процесс и снизить требования к вычислительным ресурсам. Если в исходной реализации использовалось порядка 32 млрд параметров, то в RAGU их число удалось сократить почти на два порядка — не только без потери качества, но и с его заметным улучшением.

Помимо специалистов НГУ, в проекте участвовали представители других российских вузов, включая МГУ, Балтийский федеральный университет имени Иммануила Канта, Университет науки и технологий МИСИС, Дальневосточный федеральный университет и Университет ИТМО.

Проект RAGU стал победителем в номинации «Инновации в области искусственного интеллекта» конкурса «Код без границ». Всего в конкурсе приняли участие более 200 проектов.

RSS: Новости на портале Anti-Malware.ru