Перейти к содержанию
Сергей Ильин

Роскомнадзор намерен поставить онлайн-СМИ под автоматический контроль

Recommended Posts

Сергей Ильин

Федеральная служба по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор) объявила открытый конкурс на разработку и поставку программно-аппаратного комплекса контроля публикаций интернет-СМИ - стоимость проекта чиновники оценили в 15 миллионов рублей, сообщил РИА Новости помощник руководителя Роскомнадзора Михаил Воробьев.

Система будет автоматически выявлять признаки нарушения российского законодательства как в публикациях зарегистрированных онлайн-СМИ, так и в комментариях читателей к этим публикациям.

Используя обновляемые тезаурусы ключевых слов и выражений, система должна в реальном времени автоматически информировать операторов о признаках нарушения законодательства о СМИ на сайтах интернет-изданий. В число требований к системе, установленных техническим заданием, входит возможность обработки текстовых документов различных форматов, а также графических, аудио- и видеоматериалов. Предусмотрен контроль материалов на предмет соответствия формальным требованиям, ограничивающих их распространение - как, например, в случае контента, не предназначенного для детей.

При выявлении признаков нарушения система должна сформировать отчет, содержащий копию текста, его фрагмента, графического, аудио- или видеоматериала и (или) ссылку на данный материал. Оператор осуществляет первичный контроль, прочитывая отчеты системы, и направляет их специалистам для принятия решения о нарушениях действующего законодательства со стороны СМИ.

http://www.rian.ru/science/20110322/356635544.html

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
Danilka
стоимость проекта чиновники оценили в 15 миллионов рублей

Пропали бабки. Мда.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
Valery Ledovskoy
Пропали бабки. Мда.

[not for indexing]

На самом деле для такого проекта мало. Пилить особо нечего. Видимо, исполнитель уже известен, и известна официальная причина, которую объявят, когда осуществить идею не получится.

[/not for indexing]

:)

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
priv8v

неужели все так плохо? )))

да я даже за какой-то жалкий миллион готов такое сделать. выйдет в 300 строк кода на php + гуй приложение на самом компе (не считая кода интерфейса строк 100)

:)

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
Сергей Ильин

Valery Ledovskoy, Danilka а почему вы думаете, что бабки пропали? Могут ведь и сделать. Такое у нас иногда бывает, когда правильно мотивируют с самого верха. Тут как раз такой случай.

Возмут как-то поисковый движок, поднастроят, прикрутят систему репортов и готово. Например, на базе того же SearchInform наверняка такое не сложно поднять.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
Danilka
Valery Ledovskoy, Danilka а почему вы думаете, что бабки пропали? Могут ведь и сделать. Такое у нас иногда бывает, когда правильно мотивируют с самого верха. Тут как раз такой случай.

Возмут как-то поисковый движок, поднастроят, прикрутят систему репортов и готово. Например, на базе того же SearchInform наверняка такое не сложно поднять.

ИМХО - интуиция. А по факту:

стоимость проекта чиновники оценили в 15 миллионов рублей

Маловато денег. И, как обычно бывает, "Хотели как лучше, а получилось как всегда." Но если будет иначе, то значит ошибаюсь. Посмотрим.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
Chekm
Система будет автоматически выявлять признаки нарушения российского законодательства как в публикациях зарегистрированных онлайн-СМИ, так и в комментариях читателей к этим публикациям.
... возможность обработки текстовых документов различных форматов, а также графических, аудио- и видеоматериалов.
да я даже за какой-то жалкий миллион готов такое сделать. выйдет в 300 строк кода на php + гуй приложение на самом компе (не считая кода интерфейса строк 100)

:)

То есть текстовые документы, аудио- видео материалы, графика, всё это проверить на "признаки нарушения российского законодательства" и + поисковик на все электронные СМИ, ЖЖ, You Tube и т.д. и на всё это 300 строк кода? Т.е этакий электронный полицейский на удивление хорошо знающий законы....

имхо: это вообще невозможно. Это ещё одна возможность попилить.

Попробуйте формализовать: http://s006.radikal.ru/i213/1103/1e/67b6aac76852.jpg

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
priv8v
То есть текстовые документы, аудио- видео материалы, графика, всё это проверить на "признаки нарушения российского законодательства" и + поисковик на все электронные СМИ, ЖЖ, You Tube и т.д. и на всё это 300 строк кода? Т.е этакий электронный полицейский на удивление хорошо знающий законы....

имхо: это вообще невозможно. Это ещё одна возможность попилить.

1. Искать нужно не на всех сайтах, а на определенных, т.е создается база этих сайтов (обновляемая) на которых будет производиться поиск (база может быть просто в файле, по адресу на строку).

Система будет автоматически выявлять признаки нарушения российского законодательства как в публикациях зарегистрированных онлайн-СМИ, так и в комментариях читателей к этим публикациям.

2. Нужно создать обновляемую базу (тот же самый файл) с ключевиками и правилами (отдаленное подобие антимат фильтра в двиге дле, допустим), также файл на строку по правилу. Т.е вариации окончаний, расстояние между ними и т.д - т.е разработать синтаксис правил. Эти две базы будет парсить те самые, вышеупомянутые 300 строк кода ...

Используя обновляемые тезаурусы ключевых слов и выражений, система должна в реальном времени автоматически информировать операторов о признаках нарушения законодательства о СМИ на сайтах интернет-изданий.

3. Видео/фото не нужно обрабатывать. Достаточно сделать наподобие технологии яндекс.фотки и давать уже только линки оператору. Небольшие флосы (штуки три в день - ничего страшного). К тому же видео не так уж и много на новостных сайтах, те у кого есть (первый канал и т.д - проверять на законность не нужно, у них у самих там проверяющих немерено, хотя это и ясно).

4. Про непредназначенность для детей - можно парсить результаты род. контроля киса на клиентской стороне разумеется ...

Т.е этакий электронный полицейский на удивление хорошо знающий законы....

Выше было написано про поиск по ключевикам. А это (как я понял) про призывы к насилию, терроризму, убийства власти и т.д

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

  • Сообщения

    • demkd
      прогресс теперь графически отображается на плашке окна, проценты в заголовке больше не нужны, убрано все лишнее что влияло на производительность. Если нет реестра это проблема и с ней надо разбираться, а если есть то он подключен и анализируется.
        что значит поиском по эцп? по имени подписавшего файл или по сертификату или по хэшу сертификата.
        В прошлых версиях оно выводилось в 2х кодировках последовательно, что просто забивало лог мусором,  причем в разных системах правильная кодировка своя я опрометчиво решил, что нашел способ выбирать правильную, но оказывается в 7ке все не так как в младших и старших системах, придется для нее прописывать кодировку отдельно.
    • PR55.RP55
      + uVS v4.99.0v x64 [http://dsrt.dyndns.org:8888]: Windows 7 Home Basic x64 (NT v6.1 SP1) build 7601 Service Pack 1 [C:\WINDOWS] В прошлых версиях - всё читается нормально.
    • PR55.RP55
      1. По поводу реестра - важнее, что было найдено. Если реестра\копии нет... 2. Проценты те, что были в прошлых версиях при массовой проверке на V.T. https://forum.esetnod32.ru/bitrix/components/bitrix/forum.interface/show_file.php?fid=129963&width=500&height=500 3. Например есть файл подписанный некой ЭЦП. но... данного файла пока нет на V.T. т.е. o В контекстное меню добавлен поиск по имени объекта на Яндекс и Google. искать не только по имени объекта -  но открывать сразу две страницы - одну с точным поиском по имени. другую с точным поиском по ЭЦП.  
    • demkd
      Это нормально, реестр для псевдопользователя "All users" бывает редко, для чего системе он нужен, я не разбирался еще, но он бывает, теперь при отсутствии пользовательского реестра выдается такое сообщение, как и в случае если реестр поврежден.
      Т.е. в этом случае сообщение можно смело игнорировать.
        о каких % речь?
        Подробнее, что именно искать и зачем?
    • PR55.RP55
      + Я не вижу % при массовой проверке файлов на V.T. o В контекстное меню добавлен поиск по имени объекта на Яндекс и Google. Я бы добавил поиск по ЭЦП
×