ABBYY усилила FineReader Engine технологиями искусственного интеллекта

ABBYY усилила FineReader Engine технологиями искусственного интеллекта

ABBYY усилила FineReader Engine технологиями искусственного интеллекта

ABBYY представила новую версию ABBYY FineReader Engine 12 — инструментария разработчика для распознавания информации из отсканированных бумажных и PDF-документов, изображений и фотографий, а также скриншотов с экранов устройств, в том числе промышленных дисплеев.

В новой версии, созданной с применением сверточных нейронных сетей, используются технологии обработки естественного языка и машинного обучения. С их помощью можно определить тип документа не только по внешним признакам, но и по его смыслу, выявляя малейшие отличия между разными категориями.

Среди новых возможностей можно отметить:

  • Интеллектуальная классификация: технология самостоятельно выявляет внешние и смысловые признаки, характерные для документов. Эффективность работы можно регулировать за счет установления баланса между полнотой и точностью классификации.
  • Улучшен анализ и восстановление логической структуры документа с помощью алгоритмов на основе искусственного интеллекта и технологий ABBYY-ADRT (Adaptive Document Recognition Technology). ABBYY FineReader Engine делит документ на отдельные страницы и анализирует оформление и содержание каждой из них. При экспорте в различные форматы файлов получается точно воссозданный документ с полным сохранением элементов форматирования, например, шрифтов, колонтитулов, колонок и др. Значительно улучшено качество восстановления таблиц: ячеек с текстом, пунктирных границ, цветов линий.
  • Более быстрый и расширенный экспорт в XML.
  • Появилась возможность сохранять файлы в форматах HTML 5 и ALTO 3.1. Кроме того, теперь документы можно экспортировать в новые форматы PDF: PDF 2.0, PDF/UA, PDF/A-2b и PDF/A-3b с возможностью поиска, что особенно важно для архивного хранения.
  • Более надежное шифрование: поддержка 256-битного AES-шифрования и поддержка символов юникода позволяет использовать пароли независимо от операционной системы.
  • Поддержка облачных технологий: теперь развернуть приложения с использованием ABBYY FineReader Engine можно и на облачных платформах, таких как Microsoft Azure.

«В новом ABBYY FineReader Engine мы использовали передовые технологии в области машинного обучения и обработки естественного языка, которые позволяют наиболее точно классифицировать документы по смыслу и распознавать полезные данные. Эти возможности будут особенно востребованы в системах предотвращения утечек данных, технологиях машинного зрения и платформах для управления контентом предприятий, в которых важную роль играет быстрое распознавание документов», – комментирует Дмитрий Шушкин, генеральный директор ABBYY Россия.

Инструментарий ABBYY FineReader Engine 12 содержит готовые примеры кода, которые помогут ускорить разработку приложений. С их помощью можно решить наиболее распространенные задачи по интеллектуальной обработке документов.

ABBYY FineReader Engine поддерживает 208 языков распознавания, в том числе в новой версии добавлены фарси и бирманский. Также технология позволяет распознавать документы, которые содержат сразу несколько языков. Это расширяет возможности компаний при выводе решений на международный рынок.

Linux-бэкдор GoGra маскирует атаки под работу Outlook и Microsoft Graph

Исследователи обнаружили вариант бэкдора GoGra для Linux, который маскирует командный трафик под вполне легитимную активность Microsoft. Вместо привычной C2-инфраструктуры зловред использует почтовый ящик Outlook и Microsoft Graph API, чтобы незаметно получать команды и отправлять результаты их выполнения.

Эту кампанию связывают с группировкой Harvester, которая, по оценке Symantec, занимается кибершпионажем и активна как минимум с 2021 года.

По данным специалистов, новая Linux-версия GoGra была найдена в образцах, загруженных на VirusTotal. Исследователи считают, что первоначальное заражение начинается с того, что жертву убеждают запустить ELF-файл, замаскированный под PDF-документ.

После запуска дроппер на Go разворачивает полезную нагрузку, закрепляется в системе через systemd и XDG autostart, а для маскировки притворяется легитимным системным монитором Conky.

Главная хитрость GoGra — канал связи. Зловред использует встроенные Azure Active Directory credentials, получает OAuth2-токены и через Microsoft Graph API подключается к Outlook-почте.

Дальше он каждые две секунды проверяет директорию с названием «Zomato Pizza» и ищет письма, тема которых начинается со слова «Input». Содержимое таких писем закодировано в base64 и зашифровано по AES-CBC; после расшифровки команды выполняются локально на машине жертвы. Результат затем снова шифруется и отправляется оператору в ответном письме с темой «Output». Чтобы замести следы, зловред ещё и удаляет исходное письмо с командой через HTTP DELETE.

Исследователи отдельно подчёркивают, что Linux-вариант почти полностью повторяет Windows-версию GoGra. Совпадают не только архитектура и логика работы, но даже опечатки в строках и названиях функций, а также AES-ключ. Всё это указывает на одного и того же разработчика и усиливает привязку к Harvester.

Сам по себе приём с Microsoft Graph API тоже не новинка, но он остаётся очень удобным для шпионских операций. Трафик к Microsoft 365 и Outlook редко вызывает подозрения, а значит, вредоносная активность дольше растворяется в нормальном корпоративном фоне.

RSS: Новости на портале Anti-Malware.ru