Пермские ученые разработали фильтр для «враждебного» контента

Пермские ученые разработали фильтр для «враждебного» контента

Ученые Пермского государственного национального исследовательского университета (ПГНИУ) разработали программу для фильтрации в интернете противоправного контента — экстремистских и оскорбительных высказываний, сообщает пресс-служба вуза.

В настоящее время в рунете, по данным проведенного учеными анализа веб-текстов разных стран, господствует речевой терроризм. Чило таких нарушений в российском интернете гораздо выше, чем на форумах Германии и Польши. Так, около 26% комментариев в публичном секторе рунета содержат экстремистские или оскорбительные высказывания.

Аспирантка кафедры речевой коммуникации ПГНИУ Евгения Мехонина и ассистент этой кафедры Лиана Ермакова предложили инструмент фильтрации противоправного контента — инновационную программу FILTEX, с помощью которой любой пользователь сможет избавиться от противоправного контента в социальных сетях и блогах. Программа была разработана под руководством доктора филологических наук Владимира Салимовского и кандидата технических наук Даниила Курушина, сообщает digit.ru.

«Главное отличие FILTEX от других программ — технология распознавания противоправного контента. Мы используем подход известного профессора ПГНИУ Маргариты Николаевны Кожиной — подход системности речи. Он состоит в том, что на всех уровнях языка (лексическом, морфологическом, синтаксическом и других) можно выделить черты, признаки враждебности. Их можно формализовать при помощи математических методов, то есть представить в виде, понятном для машины», — приводятся в сообщении слова Мехониной.

Разработчики полагают, что этой программой можно будет воспользоваться как приложением в социальных сетях, а организации получат доступ к программе через веб-сервис. Потенциальные пользователи FILTEX — блогеры и политики, СМИ и другие организации, желающие очистить свои сайты от противоправных комментариев.

«В настоящее время у нас создан исследовательский прототип, пока нет интерфейса. Программа пока лишь помечает в тексте нужные части (противоправные высказывания). Планируется, что в будущем, по нашей задумке, программа будет, скорее всего, удалять такие предложения. Но мы будет учитывать и мнение пользователей, хотим, чтобы ее функции зависели от самой страницы, на которой она используется. То есть, чтобы были варианты: либо программа будет совсем удалять негативный текст, либо, к примеру, вообще не даст вводить его», — сказала РИА Новости Мехонина.

По ее словам, коллеги из пермского университета и других вузов страны работают в этом направлении, и уже есть подобные решения. Но никто ранее не использовал подход системности речи, а он наиболее полный. Уже весной лингвисты намерены подготовить первую пользовательскую версию разработки.

«Примерно к весне, к марту-апрелю, мы рассчитываем создать первую версию интерфейса программы, а к лету выйдем на контакт с провайдерами для продвижения разработки», — заключила Мехонина.

В настоящее время Евгения Мехонина и Лиана Ермакова уже получили свидетельства о регистрации интеллектуальной собственности на свою программу. 

 

Дуров заявил об утечке данных 19 млн человек из французской госбазы

Павел Дуров снова резко прошёлся по французским властям, на этот раз на фоне утечки данных из France Titres, бывшего ANTS, французского госоператора, который отвечает за паспорта, ID-карты, водительские права и другие документы. В своём телеграм-канале основатель Telegram заявил, что из одной государственной базы утекли имена, адреса, электронные почты и номера телефонов 19 млн человек.

На этом фоне он предупредил: следующие утечки могут оказаться ещё серьёзнее, если власти Франции добьются доступа к зашифрованным чатам и цифровым идентификаторам пользователей соцсетей.

Повод для такого заявления действительно есть. Французские власти подтвердили утечку данных с ants.gouv.fr, которая была обнаружена 15 апреля. По данным France Titres, злоумышленники получили несанкционированный доступ к данным из личных и профессиональных аккаунтов пользователей портала.

Среди затронутых сведений назывались идентификационные данные вроде имён, контактной информации и других персональных записей, хотя власти подчёркивали, что загруженные пользователями документы не были скомпрометированы.

При этом с масштабом истории пока есть нюанс. В открытых источниках фигурируют разные оценки. Ранее сама ANTS писала о базе на 12-13 млн записей, которая якобы продавалась в дарквебе и происхождение которой ещё проверялось.

В новых публикациях вокруг апрельского инцидента уже звучат цифры 18-19 млн записей, но проверка этих данных, судя по материалам, ещё продолжается. Таким образом, Дуров опирается на максимально тревожную оценку, тогда как окончательный масштаб утечки ещё до конца не прояснён.

Сам Дуров связал этот инцидент с более широкой темой — давлением государства на цифровые платформы. Его тезис простой: если даже обычная госбаза с персональными данными утекает наружу, то идея расширять доступ властей к ещё более чувствительной информации, включая зашифрованные переписки и цифровые ID, выглядит особенно рискованно.

Напомним, вчера Дуров заявил, что французские власти выдвинули против него более 10 обвинений. Кроме того, не так давно создатель Telegram раскритиковал приложение ЕС для проверки возраста.

RSS: Новости на портале Anti-Malware.ru