В паблик слили около 97 тыс. записей ПДн, — якобы базу розыска МВД РФ

В паблик слили около 97 тыс. записей ПДн, — якобы базу розыска МВД РФ

В паблик слили около 97 тыс. записей ПДн, — якобы базу розыска МВД РФ

Два дня назад на GitHub выложили файл CVS весом более 18 Мбайт, позиционируемый как база розыска МВД России. Судя по юзернейму, владелец репозитория с открытым доступом — интернет-издание «Медиазона», официально признанное иноагентом.

Опубликованный текстовый документ содержит 96 752 строки со следующими сведениями:

  • ФИО;
  • пол;
  • дата и место рождения;
  • национальность;
  • дополнительная информация (переобъявлен и кем ранее разыскивался, мера пресечения, под какими другими именами может скрываться и т. п.).

По какой статье открыто уголовное дело, в записях не указано.

Изучение списка показало, что почти все поименованные в нем люди — жители России и других стран СНГ. Среди них числятся (проверено) преступники, данные которых опубликованы на сайте МВД в разделе «Внимание, Розыск!». За помощь в их поимке силовики готовы заплатить 1 млн рублей.

В базе на GitHub встретилось также несколько громких имен — например, Кая Каллас. Недавно пресс-секретарь президента РФ Дмитрий Песков подтвердил, что премьер Эстонии и еще несколько чиновников из стран Балтии объявлены в розыск.

«Это люди, которые ответственны за решения, которые фактически являются надругательством над исторической памятью, — цитирует «Ъ» заявление представителя Кремля. — И это те люди, которые предпринимают враждебные действия по отношению и к исторической памяти, и к нашей стране».

Cloud.ru представила фильтр, скрывающий конфиденциальные данные от ИИ

На конференции GoCloud 2026 компания Cloud.ru анонсировала Guardrails Filter — инструмент для более безопасной работы с генеративным ИИ. Его задача довольно понятная: не дать конфиденциальным данным случайно утечь в большую языковую модель.

Схема работы выглядит так: сервис проверяет текст запроса, ищет в нём конфиденциальные данные — например, персональные сведения, банковские реквизиты, API-ключи и другие секреты, — затем маскирует их и только после этого отправляет обезличенный запрос в модель. Когда модель возвращает ответ, система подставляет реальные значения обратно.

Иначе говоря, пользователь получает нормальный результат, но сами чувствительные данные не уходят за пределы корпоративного контура в исходном виде.

Сейчас инструмент рассчитан на работу с моделями из сервиса Cloud.ru Foundation Models. В этой платформе доступно более 20 моделей разных типов, включая text-to-text, audio-to-text и image-text-to-text. При этом Cloud.ru отдельно уточняет, что механизм фильтрации будет доступен и в формате on-premise, то есть для установки на стороне самого заказчика.

Появление такого инструмента хорошо вписывается в общий тренд: компании всё активнее используют генеративный ИИ, но тема утечек данных остаётся одной из главных причин, почему внедрение идёт не так быстро, как хотелось бы. Особенно это чувствительно для отраслей, где много персональной и служебной информации, — например, для здравоохранения, ретейла и госсектора.

Кроме того, Cloud.ru сообщила, что добавила в Foundation Models LLM-модель российской компании HiveTrace с Guardrails-механизмом. По заявлению компании, такая модель должна лучше справляться с рисками вроде промпт-инъекций, утечки системных инструкций и некорректной обработки выходных данных.

RSS: Новости на портале Anti-Malware.ru