«Лаборатория Касперского» запатентовала технологию борьбы с графическим спамом

«Лаборатория Касперского» запатентовала технологию борьбы с графическим спамом

«Лаборатория Касперского» сообщила об успешном патентовании в США технологии обнаружения спама в растровых изображениях. Как отметили в компании, спамеры часто распространяют свои сообщения в виде изображений с целью затруднить детектирование. Для обнаружения такого спама требуется сначала выделить его из картинки. Чтобы усложнить детектирование ещё больше, спамеры используют прием зашумления фона изображения, «прыгающие» буквы и разбивают сообщение рамками и линиями. 



Обычный подход к выделению текста из изображений – использование систем оптического распознавания символов (OCR). Однако они, как правило, ресурсоёмки и не обеспечивают требуемой точности детектирования, говорится в сообщении «Лаборатории Касперского». В отличие от них запатентованная технология гарантирует точное и быстрое выделение спама из изображений. Она устойчива к зашумлению и искажению, что повышает уровень детектирования, утверждают разработчики.

В основе технологии лежит вероятностно-статистический метод, согласно которому решение о том, содержит ли изображение текст, принимается на основании характера расположения вероятных графических образов слов и строк, а также содержания в них выявленных образов букв и слов. Автор изобретения – руководитель группы развития антиспам-технологий «Лаборатории Касперского» Евгений Смирнов. 27 апреля 2010 г. Патентное бюро США выдало на технологию два патента №№ 7706613 и 7706614.

4 мая 2010 г. был получен ещё один патент № 7711192 на усовершенствованный вариант технологии. В данном варианте оптимизировано выделение объектов, в результате чего они становятся лучше различимы, а также улучшена эффективность фильтрации обнаруженного спама.

«Машинные методы оптического распознавания требуют единообразия размеров и расположения выделяемых символов. В отличие от них наша технология работает с различными вариантами наклоненных или искаженных букв и слов, что повышает точность детектирования, – отметила Надежда Кащенко, руководитель отдела по управлению интеллектуальной собственностью «Лаборатории Касперского». – Кроме того, запатентованный метод предлагает более высокую скорость обработки изображений».

Источник

Владельцев сайтов избавили от необходимости маркировки ИИ-контента

Из законопроекта о регулировании искусственного интеллекта (ИИ), разработанного Минцифры, убрали требование о маркировке контента, сгенерированного нейросетевыми инструментами, для владельцев онлайн-площадок. Это положение вызывало резкую критику со стороны маркетплейсов и крупных цифровых платформ.

В первоначальной версии законопроекта Минцифры владельцы онлайн-площадок должны были маркировать контент, созданный с помощью ИИ.

Маркировка должна была включать два элемента: видимое обозначение, отображаемое при просмотре или воспроизведении, а также машиночитаемую метку в метаданных.

По оценке АНО «Цифровая экономика», участниками которой являются многие цифровые платформы, выполнение этой нормы потребовало бы от владельцев онлайн-площадок фактически ручной модерации контента. Автоматизированных инструментов, которые позволяют с достаточной достоверностью выявлять такой контент без участия человека, пока нет. Это привело бы к значительным затратам.

Директор по стратегическим проектам Института исследований интернета Ирина Левова в комментарии для «Известий» сравнила целесообразность такой нормы с требованием маркировать музыку, исполненную на синтезаторе:

«Тратить огромные деньги на определение способа создания контента, который сам по себе не обязательно плох или хорош, бессмысленно. В законопроекте осталась обязанность платформ предоставить пользователям возможность сообщить, что при его создании использован ИИ. Такая модель стимулирует нормальный ответственный подход пользователей».

В RWB (Wildberries & Russ) газете назвали такую маркировку не имеющей практической ценности. По мнению компании, она могла бы усложнить пользовательский опыт и снизить удовлетворённость пользователей сервисами. Кроме того, подобные меры могут создать необоснованные барьеры для уже внедрённых решений и в целом замедлить развитие технологий ИИ.

Эксперт НТИ по технологиям ИИ Леонид Дробышевич также отметил, что необходимость маркировки порождает много вопросов, на которые не всегда можно дать однозначные ответы:

«Например, считать ли ИИ-контентом текст, который человек написал сам, но исправил с помощью нейросети? Или видео, где ИИ использовался только для шумоподавления и монтажа? Без чётких технологических критериев платформы были бы вынуждены либо модерировать с запасом, удаляя сомнительные материалы, либо массово игнорировать нарушения. Оба сценария создают риски, например чрезмерной цензуры и недовольства пользователей».

«Мера была смягчена по итогам обсуждения законопроекта с бизнес-сообществом, — прокомментировали «Известиям» в аппарате вице-премьера Дмитрия Григоренко. — Согласно текущей версии документа, обязанность по машиночитаемой маркировке аудиовизуального контента, сгенерированного с помощью ИИ, лежит на владельцах ИИ-сервисов, а конкретные случаи обязательной маркировки будут определяться правительством».

В целом, как отметил источник издания, близкий к правительству, целью поправок было снижение нагрузки на бизнес. По данным другого источника, финальный вариант законопроекта планируется внести в Госдуму до середины июля.

RSS: Новости на портале Anti-Malware.ru