Роскомнадзор будет вести реестр запрещенных сайтов с помощью ИИ

Роскомнадзор будет вести реестр запрещенных сайтов с помощью ИИ

Роскомнадзор будет вести реестр запрещенных сайтов с помощью ИИ

Роскомнадзор собирается привлечь ИИ к поиску кандидатов на занесение в Единый реестр запрещенных ресурсов. По плану, умный помощник будет интегрирован в существующую систему веб-мониторинга и анализа контента уже в этом году.

Как выяснил «Ъ», сейчас выявление нарушений российского закона об информации (№149-ФЗ от 27.07.2006) в интернете происходит по заданным алгоритмам обработки текстов. Внедрение ИИ-технологий, как надеется регулятор, позволит ускорить процесс, повысить его эффективность и сократить издержки.

В 2023 году РКН выявлял противозаконный веб-контент через три часа после его публикации; в 2024 году интервал планируется сократить до двух часов, в 2026-м — до одного часа. Блокировка ресурса, попавшего в реестр запрещенных, требует больше времени — в 2022 году на нее уходило до 50 дней.

Использование ИИ также поможет улучшить качество анализа: подобный помощник способен разобраться в сложном контексте, найти скрытые связи и закономерности. Долю ложноположительных срабатываний планируется за два года снизить до 10% (в прошлом году составила 20%).

В 2026 году РКН намеревается таким же образом озадачить ИИ ведением реестра операторов персональных данных, однако опрошенные «Ъ» эксперты сомневаются в успехе. Автомат может выявить оператора ПДн только по открытой информации, да и то лишь в тех случаях, когда ее легко вытащить из документа и подвергнуть анализу.

Не исключено, что с этой целью умному помощнику придется регистрироваться на сайтах, но админы такие действия обычно блокируют.

Cloud.ru представила фильтр, скрывающий конфиденциальные данные от ИИ

На конференции GoCloud 2026 компания Cloud.ru анонсировала Guardrails Filter — инструмент для более безопасной работы с генеративным ИИ. Его задача довольно понятная: не дать конфиденциальным данным случайно утечь в большую языковую модель.

Схема работы выглядит так: сервис проверяет текст запроса, ищет в нём конфиденциальные данные — например, персональные сведения, банковские реквизиты, API-ключи и другие секреты, — затем маскирует их и только после этого отправляет обезличенный запрос в модель. Когда модель возвращает ответ, система подставляет реальные значения обратно.

Иначе говоря, пользователь получает нормальный результат, но сами чувствительные данные не уходят за пределы корпоративного контура в исходном виде.

Сейчас инструмент рассчитан на работу с моделями из сервиса Cloud.ru Foundation Models. В этой платформе доступно более 20 моделей разных типов, включая text-to-text, audio-to-text и image-text-to-text. При этом Cloud.ru отдельно уточняет, что механизм фильтрации будет доступен и в формате on-premise, то есть для установки на стороне самого заказчика.

Появление такого инструмента хорошо вписывается в общий тренд: компании всё активнее используют генеративный ИИ, но тема утечек данных остаётся одной из главных причин, почему внедрение идёт не так быстро, как хотелось бы. Особенно это чувствительно для отраслей, где много персональной и служебной информации, — например, для здравоохранения, ретейла и госсектора.

Кроме того, Cloud.ru сообщила, что добавила в Foundation Models LLM-модель российской компании HiveTrace с Guardrails-механизмом. По заявлению компании, такая модель должна лучше справляться с рисками вроде промпт-инъекций, утечки системных инструкций и некорректной обработки выходных данных.

RSS: Новости на портале Anti-Malware.ru