InfoWatch развивает лингвистические технологии Traffic Monitor

InfoWatch развивает лингвистические технологии

Российский ИТ-разработчик InfoWatch расширил один из ключевых компонентов своего решения InfoWatch Traffic Monitor - Базу Контентной Фильтрации (БКФ). БКФ является ядром собственной уникальной технологии лингвистического анализа и используется для категоризации информации и детектирования конфиденциальных данных в информационных потоках компании.

Возможности обновленной базы контентной фильтрации отныне позволяют решать задачи как корпоративного, так и государственного масштаба, например, такие как соблюдение исполнения законодательства РФ по борьбе с экстремизмом, коррупционной деятельностью, по противодействию распространению наркотических средств, порнографической продукции и т.п.

Об остроте этих вопросов свидетельствует неумолимая статистика: в период с 2008 по 2009 годы количество экстремистских сайтов в рунете выросло в 5 раз. По данным, опубликованным на сайте Российской газеты, Россия занимает второе место в Сети после США по распространению порнографических сайтов. Ситуация с коррупцией в России тоже оставляет желать лучшего.

Не секрет, что довольно часто нелигитимный контент распространяется сотрудниками компаний за счет работодателя. С этой угрозой и борется InfoWatch Traffic Monitor. Не имеющие аналогов в мире базы контентной фильтрации позволяют регулировать обращение подобной противозаконной информации. Данные БКФ содержат более 4000 терминов, распределенных по таким категориям, как коррупция, наркотики, терроризм, проституция, порнография и др. С помощью этих баз можно выявлять в информационных потоках организации как определенные термины, так и сложные цепочки слов, а также категоризировать полученные данные по областям: например, информация экстремистского толка, данные о коррупционной деятельности, сведения, относящиеся к распространению порнографии, наркотиков и т.п.

При том, что большая часть такого рода информации не создается в организациях специально и не хранится в определенных местах в корпоративной сети, а создается злоумышленниками спонтанно и почти сразу уходит из организации во внешний мир, единственная возможность отследить и пресечь использование ресурсов компании в противоправных целях – анализ информации в режиме онлайн.

Частое общение с ИИ-ботами не проходит бесследно: из людей посыпался слоп

ИИ настолько стремительно вторгся в нашу жизнь, охватив многие ее аспекты, что начал даже оказывать влияние на манеру изъясняться. Люди, сами того не замечая, все чаще употребляют замысловатые словечки и фразы из репертуара ChatGPT.

Как оказалось, расширение использования больших языковых моделей (БЯМ, LLM) не только пошло им на пользу, но также записало на подкорку живых собеседников странный диалект, выработанный ИИ в ходе генерации текстов.

В июле прошлого года институт Макса Планка опубликовал результаты исследования влияния LLM на речевые коммуникации homo sapiens. Как оказалось, за 18 месяцев с момента запуска ChatGPT словарь пользователей YouTube сильно изменился, обогатившись такими выпадающими из стиля и контекста словами, как underscore (сделать акцент на…), comprehend (осмыслить, объять), bolster (консолидировать), inquiry (изыскание), meticulous (скрупулезный, доскональный, филигранный).

Недавно были выявлены похожие, но более анекдотичные случаи. Так, модераторы Reddit-веток, в которых участники сообществ со смаком обсуждают дерзкие проступки, никак не могут избавиться от слопа — постов, переписанных с помощью ИИ, а также участников дискуссий, разговаривающих в том же духе, которых невозможно отличить от чат-ботов.

Писатель Сэм Крисс (Sam Kriss) изучил последние публикации в New York Times Magazine и обнаружил, что их авторы явно злоупотребляют словом «delve» (штудировать), позаимствованным у ИИ.

Исследователь также отметил, что даже британские парламентарии не брезгуют советоваться с ChatGPT, подготавливая свою речь. Об этом свидетельствует фраза «I rise to speak», однажды озвученная за день 26 раз, — характерная для американского английского, но совершенно неуместная при выступлении в Вестминстерском дворце.

Еще один курьез, подмеченный Киссом: в сентябрьских объявлениях о закрытии Starbucks кофейни были названы «неотъемлемой частью вашего суточного режима, пробуждающей воспоминания», а также «местом, где наше конструктивное общение с партнерами с годами только крепло». Текст был явно навеян общением с ИИ, если только не создан с его непосредственным участием.

RSS: Новости на портале Anti-Malware.ru