Из российских компаний утекли 1,8 петабайта данных за год

Из российских компаний утекли 1,8 петабайта данных за год

Из российских компаний утекли 1,8 петабайта данных за год

В 2025 году из российских компаний утекло почти 1,8 петабайта данных. По оценке ИБ-компании «Солар», это в 17 раз больше, чем в 2023 году, когда счёт ещё шёл на терабайты. При этом парадокс в том, что самих утечек формально стало меньше. Если в 2024 году их было больше, то в 2025-м специалисты насчитали 367 случаев, то есть снижение составило 23%.

Публичных сообщений о таких инцидентах тоже стало меньше — 722, это на 27% ниже год к году. Но расслабляться тут явно рано: как подчёркивают в «Соларе», в среднем хакеры всё равно публикуют базы данных каждый день.

Самый заметный вклад в статистику дали ретейл, на который пришлось 34% всех утечек, сфера услуг с долей 12%, а также блоги и форумы, которые заняли ещё 10%. В компании связывают это с тем, что в этих сегментах особенно велика доля небольших организаций, а у малого бизнеса защита часто оставляет желать лучшего.

Если посмотреть не на количество инцидентов, а на масштаб, картина становится ещё более впечатляющей. В 2025 году объём опубликованных данных достиг 1,76-1,8 петабайта, или примерно 1,8 тысячи терабайт. Всего это около 4,5 млрд строк данных. Для сравнения: по числу опубликованных строк рост к 2024 году оказался трёхкратным.

Внутри этого массива специалисты заметили как минимум 337 млн строк с номерами телефонов и 208 млн строк с адресами электронной почты. Но в «Соларе» (передаёт ТАСС) отдельно уточняют: далеко не каждая утечка означает публикацию исключительно конфиденциальных данных.

Нередко в Сеть попадают целые дампы серверов, крупные массивы с сетевых хранилищ и внутренней инфраструктуры организаций. Именно поэтому общий объём таких публикаций может резко расти.

Интересно и то, что значительная часть утечек пришлась на госсектор и другие сферы, но примерно 33% утечек именно в госсекторе оказались устаревшими. То есть не вся опубликованная информация была свежей, хотя сам факт её появления в открытом доступе, конечно, спокойствия не добавляет.

На фоне этой статистики в отрасли всё чаще говорят не только о предотвращении утечек, но и о готовности к последствиям. Генеральный директор «РуБэкап» Андрей Кузнецов отметил, что, хотя число утечек и публичных сообщений о них сократилось, сама проблема никуда не исчезла и касается уже практически всех отраслей российской экономики.

По его словам, штрафы и внимание государства действительно подтолкнули бизнес относиться к теме серьёзнее, но этого всё равно недостаточно: компаниям нужно самим поднимать вопрос защиты данных в приоритет. Он также отметил рост интереса к системам резервного копирования как к способу снизить не только риск утечки, но и ущерб от инцидентов.

ИИ научился находить владельцев скрытых аккаунтов в соцсетях

Искусственный интеллект, который многим кажется удобным помощником для работы и поиска информации, оказался ещё и очень полезным инструментом для деанонимизации. Новое исследование показало, что большие языковые модели могут заметно упростить поиск владельцев анонимных аккаунтов в соцсетях.

Схема такая: ИИ анализирует всё, что человек пишет в анонимном профиле, вычленяет характерные детали, а потом ищет совпадения на других платформах, где пользователь уже выступает под настоящим именем или хотя бы менее скрытно. И во многих тестах такой подход срабатывал довольно точно.

Авторы исследования, Саймон Лермен и Даниэль Палека, прямо говорят: большие языковые модели сделали подобные атаки не только возможными, но и экономически оправданными. По их мнению, это заставляет буквально заново пересмотреть представление о том, что вообще можно считать конфиденциальностью в интернете.

В рамках эксперимента исследователи «скармливали» модели анонимные аккаунты и просили собрать максимум доступной информации. Дальше ИИ сопоставлял детали из постов с другими открытыми источниками. Пример, который приводят авторы, выглядит почти бытовым: человек пишет о проблемах в школе и о прогулках с собакой по кличке Бисквит в парке Мишен Долорес. Для живого человека это может быть просто набор мелочей. Для ИИ — уже почти готовый пазл.

Дальше модель ищет, где ещё в интернете встречается такой же набор деталей, и с высокой вероятностью связывает анонимный аккаунт с конкретным человеком. И это, пожалуй, самое неприятное в истории: ничего взламывать тут не нужно. Достаточно открытых данных и модели, которая умеет быстро собирать разрозненные кусочки в цельную картину.

Исследователи отдельно предупреждают, что такая технология может использоваться не только мошенниками, но и государственными структурами для слежки за активистами и другими людьми, которые стараются высказываться анонимно.

А для киберпреступников это ещё и удобный путь к целевым атакам — например, к персонализированному фишингу, когда жертве пишут так убедительно, будто сообщение отправил знакомый человек.

По сути, ИИ делает массовое OSINT-наблюдение куда доступнее. Раньше для такой работы нужны были время, навыки и терпение. Теперь во многих случаях хватает публично доступной модели и подключения к интернету. Именно это и вызывает тревогу у специалистов по кибербезопасности.

Впрочем, исследователи и эксперты подчёркивают, что ИИ тут не всесилен. Большие языковые модели всё ещё ошибаются, а иногда и откровенно фантазируют. Из-за этого возможны ложные совпадения, когда человека могут ошибочно связать с аккаунтом, к которому он вообще не имеет отношения. И это уже отдельный риск, особенно если речь идёт о политических темах или публичных обвинениях.

Ещё одна важная проблема в том, что для деанонимизации могут использоваться не только соцсети. По словам экспертов, в дело могут идти и другие открытые данные: статистические публикации, записи, сведения о поступлении, медицинские наборы данных и другие массивы информации, которые раньше считались достаточно обезличенными. В эпоху ИИ этого обезличивания может уже не хватать.

В качестве первых мер защиты авторы советуют платформам жёстче ограничивать массовый сбор данных: вводить лимиты на выгрузку пользовательской информации, отслеживать автоматический скрейпинг и ограничивать массовый экспорт данных.

А обычным пользователям рекомендация простая: чуть внимательнее относиться к тому, какие повторяющиеся детали о себе они оставляют в открытом доступе.

RSS: Новости на портале Anti-Malware.ru