Цифровые отпечатки на страже персональных данных

Цифровые отпечатки на страже персональных данных

Всякий раз, обращаясь в банк, поликлинику, страховую компанию, МФЦ и множество других организаций, мы заполняем анкеты. Много разных анкет. И везде собственноручно или с помощью оператора мы вносим в эти анкеты персональные данные. Это могут быть заявления на кредит, согласие на обработку персональных данных, типовые формы различных заявлений и договоров и т. п. Что происходит с ними потом?

Заявления и анкеты с персональными данными граждан, предоставляемые по требованию разных организаций, в некоторых случаях так и остаются в бумажном виде без перевода в цифровой. Однако стандартной практикой современных организаций является заполнение форм в электронном виде (если предоставленные данные сразу вносятся в информационную систему организации), когда клиент подписывает готовую форму, или перевод заполненных документов в электронный вариант — довольно часто подписанная анкета сразу фотографируется или сканируется. Также персональные данные присутствуют в различных договорах, заключаемых между гражданами и организациями. Кроме того, к заявлениям граждан нередко прилагаются сканы документов — паспортов, водительских удостоверений и т. п.

Утечка собранных персональных данных, разумеется, недопустима ни в каком виде, однако такие случаи не редкость. С помощью поисковых серверов можно легко найти в свободном доступе огромное количество документов: так, недавно в Сеть утекли заявления и документы Управления социальной защиты населения по городскому округу Балашиха, другим поисковым запросом можно было найти обращения граждан в Департамент транспорта Москвы, часто с прикрепленными сканами документов (паспорта, водительские удостоверения и т. п.). Известны и случаи утери заполненных анкет в бумажной форме (когда, например, «незначительная часть документов была по ошибке выброшена вместе с устаревшими рекламными материалами» у офиса Сбербанка). Риск намеренной или случайной утечки персональных данных, равно как и конфиденциальной корпоративной информации, всегда присутствует и должен быть учтен в корпоративной политике безопасности.

Заявления. Анкеты. Договоры. Что объединяет эти виды документов? Все они создаются на базе унифицированных форм. Для выявления, инспекции и предотвращения утечки такого рода данных можно использовать различные технологии контентной фильтрации — искать в документах определенные слова или их сочетания, выявлять некоторые персональные данные с помощью шаблонов регулярных выражений, а также использовать технологию цифровых отпечатков (фингерпринтов).

Типовые документы, описанные в данной статье, обладают уникальными словесными шаблонами. Пустая форма заявления или договора отличается от заполненной только наличием дополнительных сведений, содержит больше текстовых или графических данных по сравнению с образцом-шаблоном. Каждый раз при заполнении формы используется тот же исходный набор слов и данных, к которому затем добавляются собственные слова и изображения (например, подпись или печать).

Технология цифровых отпечатков позволяет выявить уникальный словесный шаблон в отправляемом по каналам сетевых коммуникаций, сохраняемом на внешний накопитель или отправленном на печать документе, сравнивая документ с имеющимся шаблоном, а точнее, с цифровым отпечатком базового документа — формы. По сравнению с методами анализа по ключевым словам или шаблонам регулярных выражений метод цифровых отпечатков является наиболее эффективным и позволяет обеспечить наименьшее число ложных срабатываний, поскольку контролируемый образец всегда входит в исходящий документ, и, как следствие, идентифицируется соответствие отпечатку.

В основе метода цифровых отпечатков лежит сопоставление документов или файлов с так называемыми цифровыми отпечатками — наборами буквенно-цифровых строк (хэшей), при помощи которых можно идентифицировать данные, хранящиеся в документе или файле.  

 

Рисунок 1. Логика проверки соответствия цифровых отпечатков документа и шаблона

Логика проверки соответствия цифровых отпечатков документа и шаблона

 

Каждый шаблон (форма) содержит описания полей, некий набор текста и пустые поля для их дальнейшего заполнения. Преобразование такого шаблона в отпечаток документа и сохранение его уникального хэш-значения для последующей классификации в базе данных цифровых отпечатков позволяет получить тип конфиденциальных данных, который затем DLP-система может сопоставить с передаваемым документом. Что важно, сам исходный документ в базе данных отпечатков не сохраняется и воссоздать его из цифрового отпечатка невозможно. При сопоставлении заполненного документа с отпечатком шаблона документа DLP-система определяет, какова степень соответствия отпечатков передаваемого документа и шаблона, и применяет заданную политику защиты от утечки данных. Такая политика может, например, запрещать пользователям отправлять исходящие сообщения с персональными данными в защищаемых формах на внешние (не корпоративные) адреса электронной почты.

Метод цифровых отпечатков можно успешно применять к большинству текстовых форм, используемых в организациях, например, бланкам заявлений, формам медицинских документов, формам отдела кадров, типовым гражданско-правовым договорам, кредитным договорам...

 

Рисунок 2. Настройка задачи сбора образцов цифровых отпечатков в DeviceLock Management Console

Настройка задачи сбора образцов цифровых отпечатков в DeviceLock Management Console

 

Новейшая версия DeviceLock DLP 8.3 позволяет снимать цифровые отпечатки с образцов конфиденциальных документов и типовых форм для сбора персональных данных, сохраняя их в собственной базе данных отпечатков, а затем сравнивать их с отпечатками защищаемых при передаче документов. Если процент соответствия отпечатков превышает требуемый порог в соответствии с заданной DLP-политикой, проверяемые документы считаются конфиденциальными и к ним в режиме реального времени применяются заданные в DLP-политике действия — блокировка передачи документа, создание теневой копии, отправка тревожного оповещения в службу ИБ.

 

Рисунок 3. Создание правила проверки содержимого с помощью цифровых отпечатков в DeviceLock Management Console

Создание правила проверки содержимого с помощью цифровых отпечатков в DeviceLock Management Console

 

Точность детектирования персональных данных в DeviceLock DLP может быть значительно повышена благодаря возможности создания правил контентной фильтрации с условиями детектирования в сколь угодно сложных комбинациях с использованием логических функций и сочетанием метода цифровых отпечатков с анализом по ключевым словам и регулярным выражениям. 

Полезные ссылки: 
Yandex Zen AMПодписывайтесь на канал "Anti-Malware" в Yandex Zen, чтобы узнавать о новостях и эксклюзивных материалах по информационной безопасности в своей персональной ленте.

RSS: Новые статьи на Anti-Malware.ru