Технологии ABBYY помогут SECURIT DLP распознавать конфиденциальные данные в графических документах

Технологии ABBYY помогут SECURIT DLP распознавать конфиденциальные данные в графических документах

Компания SECURIT, объявляет о заключении партнерского соглашения с компанией ABBYY. В рамках соглашения SECURIT сможет использовать технологию распознавания текстов ABBYY в продуктах Zlock и Zgate. Решения Zlock и Zgate, входящие в комплекс SECURIT DLP, предназначены для защиты от утечек конфиденциальной информации и персональных данных. Zlock и Zgate анализируют все выходящие за пределы корпоративной сети документы и блокируют их передачу в случае выявления нарушений действующих политик безопасности. 



Интеграция с ABBYY FineReader Engine позволит DLP-решениям SECURIT распознавать и предотвращать утечки конфиденциальных данных, содержащихся в отсканированных, рукописных и других графических документах. Для анализа распознанных текстов может использоваться более десяти технологий SECURIT. Среди них простая и эффективная технология «цифровых отпечатков» DocuPrints, лингвистический движок MorphoLogic для анализа динамических и недавно созданных документов и интеллектуальная технология SmartID с возможностью «обучения» в процессе своей работы. Для обнаружения конфиденциальной информации методом регулярных выражений в системе имеется более 50 предустановленных шаблонов персональных данных.

ABBYY FineReader Engine поддерживает распознавание текстов на 198 языках, в том числе на английском, белорусском, испанском, итальянском, казахском, китайском, немецком, русском, украинском, французском и японском. Высокие качество и скорость распознавания обеспечиваются применением собственных технологий предварительной подготовки документа — перед распознаванием происходит разделение текста и фона, исправляются возможные перекосы и «перевернутые» на 90 или 180 градусов страницы, корректируется масштаб, удаляются артефакты и искажения, обычно возникающие при сканировании или фотосъемке. ABBYY FineReader Engine поддерживает распознавание текста в BMP, DJVU, GIF, JPEG, PDF, PNG, TIFF и других распространенных форматах.

«Мы выбрали ABBYY, так как привыкли работать с лидерами в своих областях. Инструментарий для разработчика ABBYY FineReader Engine является лучшим решением для распознавания текстов и поддерживает множество языков, форматов файлов и дополнительных технологий, его использование существенно расширяет возможности наших DLP-решений. Кроме того, нас приятно удивила стабильность и скорость ABBYY SDK по сравнению с другими OCR-продуктами», — заявил Алексей Раевский, генеральный директор компании SECURIT.

«Системы защиты конфиденциальных данных от утечек должны поддерживать анализ потоков информации любого формата. В реальности, к сожалению, пока далеко не все DLP-системы способны предотвращать утечку конфиденциальных документов в графическом виде (сканы документов в pdf и других форматах, снимки экранов). Мы рады, что технологии распознавания ABBYY в составе продуктов SECURIT смогут сделать графические документы "видимыми" для процесса автоматического контроля и позволят еще более эффективно решать задачу защиты от утечек», — сказал Дмитрий Шушкин, директор по корпоративным проектам компании ABBYY Россия.

Ваши данные могут пробить по звонку или ссылке через рекламные сервисы

Исследователь Антон Бочкарев из 3side (Третья Сторона) сообщил о новой потенциальной проблеме с сервисами таргетированной рекламы, связанными с операторами связи. Если верить опубликованному разбору, некоторые из таких платформ позволяют буквально по одному звонку или одному переходу по ссылке собрать о человеке крайне подробный цифровой профиль.

Автор материала на «Хабре »напоминает, что ещё полтора года назад уже описывал похожую историю с «пробивом» абонентов через рекламный сервис.

Тогда публикация вызвала резонанс, и уязвимость, по его словам, в итоге закрыли. Но теперь, как утверждается, на других площадках ситуация может быть даже хуже.

Для регистрации в одном из таких сервисов, как пишет автор, оказалось достаточно принять СМС на любой номер. После этого пользователю открывались инструменты настройки рекламной аудитории: геолокация, фильтрация по звонкам, интересам, сайтам, данным о полученных сообщениях и другим признакам.

Самое неприятное здесь — сочетание этих фильтров. По описанию автора, можно сузить аудиторию сначала по геозоне, затем по факту звонка с определённого номера, а потом ещё сильнее сократить выборку за счёт пересечений и дополнительных параметров. В результате, как утверждается в публикации, удаётся фактически деанонимизировать конкретного человека: понять, где он живёт, где бывает, где работает и какими сервисами пользуется.

 

 

Отдельное внимание автор уделяет так называемым рекламным счётчикам. Логика здесь такая: если поставить счётчик на сайт и заманить туда конкретного человека, то затем его визит можно использовать как фильтр в рекламной системе. А дальше — попытаться получить о нём уже куда более широкий набор данных, чем просто факт посещения страницы.

Среди параметров, которые, по словам автора, доступны в таких системах, — пол, возраст, уровень дохода, интересы, посещаемые сайты, отправители СМС, сведения о звонках, семейный статус, наличие недвижимости, автомобиля и даже данные о детях. Если всё это действительно доступно в описанном виде, речь идёт уже не просто о рекламной аналитике, а о крайне удобном инструменте для слежки и «пробива».

Отдельно подчёркивается, что для подобных действий якобы не нужно запускать реальную рекламную кампанию и тратить деньги: достаточно этапа предварительной оценки аудитории. И именно это, по мнению автора, делает проблему особенно опасной — входной порог минимален, а потенциальная польза для злоумышленников огромна.

При этом в публикации прямо говорится, что проблема, по мнению автора, носит системный характер. Даже если один конкретный сервис закроет такую возможность, аналогичные механики могут оставаться у других игроков рынка. Более того, автор отдельно утверждает, что данные между участниками этого сегмента могут передаваться и использоваться шире, чем кажется обычному абоненту.

В итоге пользователям стоит исходить из того, что их мобильная активность может быть куда менее приватной, чем принято думать. А главный вывод здесь, пожалуй, в том, что вопрос уже давно не только в рекламе. Когда инструменты маркетинга позволяют восстанавливать личные связи, маршруты и цифровые привычки конкретного человека, это выглядит уже как история про массовую слежку под вполне легальной вывеской.

RSS: Новости на портале Anti-Malware.ru