Роскомнадзор тестирует систему мониторинга онлайн-изданий

Роскомнадзор тестирует систему мониторинга онлайн-изданий

Роскомнадзор начал тестирование системы автоматического мониторинга онлайн-изданий, которая должна заработать не позднее IV квартала текущего года. Об этом сообщил официальный представитель Роскомнадзора Вадим Ампелонский.

«Задача системы — поиск нецензурной брани в статьях и комментариях»,— сообщил он газете «Известия». Сегодня специалисты ведомства ищут запрещённую лексику в интернет-СМИ в ручном режиме.

Представитель ведомства добавил, что сейчас программа активно дорабатывается, функционировать в полную силу она начнёт до конца 2014 года. В данный момент специалисты составляют для неё список ключевых слов. Сначала настройки будут заданы только для поиска текстов и изображений, но не исключено, что в будущем она сможет работать с аудио и видео, сообщает russian.rt.com.

Полная стоимость создания системы оценивается в 25 млн рублей, отмечает издание. Пока программа не начала работать полноценно, специалисты Роскомнадзора в ручном режиме просматривают порядка 5 тыс. СМИ.

Вадим Ампелонский добавил, что идея системы мониторинга СМИ появилась давно. Ещё в апреле 2011 года Роскомнадзор объявил конкурс на создание системы поиска на сайтах СМИ материалов, содержащих пропаганду экстремизма, наркотиков и порнографии. Максимальная цена контракта составляла 15 млн рублей. Конкурс выиграла компания «ДатаЦентр», оценившая свою работу в 4,6 млн рублей. Однако представленное подрядчиком решение не устроило заказчика.

В феврале 2013 года Арбитражный суд Москвы постановил, что разработанный «ДатаЦентром» программно-аппаратный комплекс для мониторинга СМИ не соответствует техническому заданию и не может выполнять возложенные на него задачи. Ответчика обязали выплатить Роскомнадзору полученные 1,5 млн рублей. 

Нейросеть для ЖКХ научилась материться в первый месяц обучения

Разработчикам отечественного голосового помощника для сферы ЖКХ пришлось «переучивать» систему после того, как в процессе обучения бот освоил ненормативную лексику. Этот случай наглядно показал, насколько критично качество данных, на которых обучаются нейросети.

О возникшей проблеме рассказал ТАСС президент Национального объединения организаций в сфере технологий информационного моделирования (НОТИМ) Михаил Викторов на Сибирском строительном форуме, который проходит в Новосибирске.

«Приведу забавный случай: нейросеть учится, и буквально уже в первый месяц разработчики обнаружили такую коллизию — нейросеть научилась мату. Как говорится, с кем поведёшься, от того и наберёшься. Эту проблему, конечно, пришлось устранять. Но это в том числе показатель активного взаимодействия с нашими гражданами», — рассказал Михаил Викторов.

При этом, по его словам, внедрение ботов позволило сократить число операторов кол-центров в 5–6 раз без потери качества обслуживания. Нейросетевые инструменты способны обрабатывать до 90% входящих обращений.

Уровень удовлетворённости качеством обслуживания, по оценке Викторова, составляет около 80%. Передавать звонки операторам целесообразно лишь в экстренных случаях — например, при аварийных ситуациях.

Эксперты ранее отмечали, что именно данные, на которых обучается ИИ, являются ключевой причиной появления некорректных или предвзятых ответов нейросетевых инструментов.

RSS: Новости на портале Anti-Malware.ru