ФБР планирует увеличить базу распознавания лиц до 52 млн изображений

ФБР планирует увеличить базу распознавания лиц до 52 млн изображений

Фонд электронных рубежей опубликовал новые документы о биометрической базе данных Next Generation Identification (NGI), которая разрабатывается по заказу ФБР и должна начать работу летом 2014 года. Документы получены в ходе судебного процесса против ФБР по поводу засекречивания информации об этом проекте.



В соответствии с документами, базу NGI уже в следующем году планируют расширить до 52 млн индивидуальных записей. В перспективе она может содержать биометрические данные на треть населения США. ФБР намерено получить часть информации из «гражданских источников», то есть для распознавания лиц людей, которые, возможно, никогда не совершали преступлений.

Фонд электронных рубежей предупреждает, что автоматическое распознавание лиц в таком масштабе представляет реальную угрозу для неприкосновенности частной жизни всех американцев, пишет habrahabr.ru

NGI создаётся на основе имеющейся базы с отпечатками пальцев 100 млн человек. Система следующего поколения использует для биометрической идентификации не только отпечатки, но и результаты сканирования радужной оболочки глаза, распознавание лиц и прочие методы. В ФБР биометрическая информация привязана к личному досье гражданина с указанием имени, домашнего адреса, номера водительского удостоверения, иммиграционного статуса, возраста, этнической принадлежности и т.д. Доступ к базе имеют другие федеральные агентства, а также около 18 000 региональных подразделений правоохранительных органов.

Документы показывают, что в 2012 году в NGI хранилось 13,6 млн изображений для автоматического распознавания лиц от 7 до 8 млн человек, в середине 2013 года размер БД вырос до 16 млн изображений, а новые документы показывают, что NGI способна добавлять до 55 000 новых изображений в день и обрабатывать десятки тысяч поисковых запросов в сутки.

По плану ФБР, в следующем году база для распознавания лиц может вырасти до 52 млн фотографий, из которых 46 млн «криминальных изображений», 4,3 млн «гражданских изображений» и около 1 млн изображений из неназываемых источников, в том числе из «новых репозиториев».

Сбор фотографий граждан уже начался: во многих организациях, которые требуют специального допуска, у людей берут не только отпечаток пальца, но и фотографируют. Информацию отправляют в ФБР.

«Раньше ФБР никогда не связывало криминальную и гражданскую базы данных отпечатков пальцев. Таким образом, любой поисковый запрос по первой БД не поступал во вторую, — пишет Фонд электронных рубежей. — С внедрением NGI всё изменится. Теперь каждой записи, уголовной или нет, будет присвоен универсальный контрольный номер (UCN), и каждый запрос будет запущен для всех записей в базе». Это означает, что даже гражданина без криминальной истории могут случайно распознать в качестве подозреваемого по любому уголовному делу. Независимые исследования показывают, что вероятность ложных срабатываний существенно возрастает при увеличении размера выборки, а с 52 млн фотографий выборка будет очень большой. 

Подрядчиком по внедрению NGI является компания MorphoTrust (бывшая L-1 Identity Solutions), которая разработала и поддерживает работу крупнейшей в мире системы распознавания лиц Госдепартамента США. Она содержит фотографии более 244 млн граждан преимущественно иностранных государств, которые когда-либо подавали заявления на американскую визу или паспорт.

Объемы утечек данных из российских сервисов выросли в 1,5 раза

В 2025 году в открытый доступ попали базы данных 230 российских организаций — в общей сложности 767 млн строк. Хотя количество утечек за год сократилось почти вдвое, объём скомпрометированных данных, напротив, вырос в 1,5 раза. Всего аналитики зафиксировали 250 новых публичных утечек баз данных компаний России и СНГ, при этом на российские организации пришлось 230 инцидентов.

Для сравнения: в 2024 году было выявлено 454 аналогичных случая. Такие данные привёл «Коммерсантъ» со ссылкой на аналитиков Threat Intelligence компании F6.

При этом объём утёкших данных в 2025 году оказался значительно выше: 767 млн строк против 457 млн годом ранее. Основная часть массива — около 600 млн строк — пришлась на четыре неназванных государственных сервиса.

В целом атаки на госсектор стали одной из ключевых тенденций 2025 года. Если в 2024 году в F6 зафиксировали 11 подобных инцидентов, то в прошлом году — уже 17 новых утечек. Правда, часть из них относится к более ранним периодам и была опубликована только в 2025 году.

Большинство баз злоумышленники выкладывают в открытый доступ бесплатно. Главная цель таких публикаций — нанести максимальный ущерб пострадавшей организации. По оценке ведущего эксперта по сетевым угрозам компании «Код Безопасности» Константина Горбунова, это связано с тем, что российские компании всё чаще отказываются платить вымогателям, которые угрожают публикацией скомпрометированных данных.

Руководитель группы международной аналитики Positive Technologies Алиса Кулишенко отмечает, что утечки всё чаще используются не как самостоятельный способ заработка, а как основа для последующих мошеннических и фишинговых кампаний. Монетизация в таких случаях происходит уже за счёт конечных жертв.

Кроме того, публикация массивов данных усиливает ущерб для пострадавших и повышает статус самих злоумышленников внутри киберпреступной среды.

Наибольший интерес у атакующих, по данным F6, вызывают базы с паролями. В 2025 году таких записей насчитали 156 млн, из них 142 млн — уникальные. Эти данные могут использоваться в мошеннических схемах и при проведении каскадных атак на крупные компании.

«В отличие от общемирового тренда, когда атакующие стараются действовать максимально тихо и надолго закрепляться в инфраструктуре — для шпионажа или подготовки масштабных диверсий, — прошлогодние атаки, например, на российские транспортные компании и торговые сети были очень громкими. Они сопровождались публикацией утечек данных, информационными вбросами и кампаниями по дискредитации пострадавших», — отмечает генеральный директор F6 Валерий Баулин.

По оценкам компании DLBI, в России практически схлопнулся классический чёрный рынок данных. Большая часть утёкшей информации перетекла в боты-пробивщики, владельцы которых оптом скупают любые более-менее ликвидные массивы.

RSS: Новости на портале Anti-Malware.ru