InfoWatch развивает лингвистические технологии Traffic Monitor

InfoWatch развивает лингвистические технологии

Российский ИТ-разработчик InfoWatch расширил один из ключевых компонентов своего решения InfoWatch Traffic Monitor - Базу Контентной Фильтрации (БКФ). БКФ является ядром собственной уникальной технологии лингвистического анализа и используется для категоризации информации и детектирования конфиденциальных данных в информационных потоках компании.

Возможности обновленной базы контентной фильтрации отныне позволяют решать задачи как корпоративного, так и государственного масштаба, например, такие как соблюдение исполнения законодательства РФ по борьбе с экстремизмом, коррупционной деятельностью, по противодействию распространению наркотических средств, порнографической продукции и т.п.

Об остроте этих вопросов свидетельствует неумолимая статистика: в период с 2008 по 2009 годы количество экстремистских сайтов в рунете выросло в 5 раз. По данным, опубликованным на сайте Российской газеты, Россия занимает второе место в Сети после США по распространению порнографических сайтов. Ситуация с коррупцией в России тоже оставляет желать лучшего.

Не секрет, что довольно часто нелигитимный контент распространяется сотрудниками компаний за счет работодателя. С этой угрозой и борется InfoWatch Traffic Monitor. Не имеющие аналогов в мире базы контентной фильтрации позволяют регулировать обращение подобной противозаконной информации. Данные БКФ содержат более 4000 терминов, распределенных по таким категориям, как коррупция, наркотики, терроризм, проституция, порнография и др. С помощью этих баз можно выявлять в информационных потоках организации как определенные термины, так и сложные цепочки слов, а также категоризировать полученные данные по областям: например, информация экстремистского толка, данные о коррупционной деятельности, сведения, относящиеся к распространению порнографии, наркотиков и т.п.

При том, что большая часть такого рода информации не создается в организациях специально и не хранится в определенных местах в корпоративной сети, а создается злоумышленниками спонтанно и почти сразу уходит из организации во внешний мир, единственная возможность отследить и пресечь использование ресурсов компании в противоправных целях – анализ информации в режиме онлайн.

Более трех четвертей россиян не отличают нейросетевой контент от реального

Согласно исследованию агентств Spektr и СКОТЧ, 77% участников не смогли отличить изображения, созданные нейросетями, от реальных фотографий. В опросе приняли участие около 1000 человек. Респондентам в случайном порядке показывали пять изображений, из которых четыре были сгенерированы ИИ, а одно — подлинное.

Результаты исследования приводит РБК. Корректно определить сгенерированные изображения смогли лишь 23% опрошенных.

При этом в более молодых возрастных группах показатели оказались выше. Среди респондентов до 30 лет правильный ответ дали 30%, в группе 31–44 года — 25%.

В числе признаков «настоящего» фото участники называли убедительные детали, реалистичные свет и тени, а также естественную улыбку человека в кадре. Например, изображение с улыбающимся мужчиной чаще других считали реальным участники в возрасте 45–60 лет — 28% из них выбрали именно этот вариант.

Примечательно, что доля тех, кто ошибается при определении ИИ-контента, растёт. Согласно результатам исследования MWS, опубликованным летом 2025 года, правильно распознать сгенерированные изображения смогли более трети респондентов.

RSS: Новости на портале Anti-Malware.ru