MWS запустила платформу для хранения данных и работы с ИИ-моделями

MWS запустила платформу для хранения данных и работы с ИИ-моделями

MWS запустила платформу для хранения данных и работы с ИИ-моделями

Компания MWS Cloud (входит в МТС Web Services) представила платформу MWS Data Lakehouse — решение для работы с данными разного типа: структурированными, неструктурированными и векторными. Платформа предназначена для задач аналитики, машинного обучения и инференса больших языковых моделей.

Среди возможностей — работа с петабайтами данных, хранение и обработка информации о продажах, логистике, заказах, платёжах и других бизнес-процессах. На базе платформы можно запускать модели для прогноза спроса, расчёта вероятности возврата кредитов, оптимизации маршрутов и других сценариев.

Одно из ключевых отличий — архитектура, которая позволяет независимо масштабировать хранение и вычисления. Это даёт гибкость в управлении ресурсами и помогает экономить: по оценкам MWS, на 40% меньше затрат по сравнению с классическими DWH-решениями. Такой эффект достигается за счёт отказа от дублирования данных, централизованного управления и автоматизации рутинных задач.

Для развёртывания можно использовать Kubernetes и совместимое с S3 объектное хранилище. Платформа поддерживает форматы Apache Parquet и Iceberg, совместима с Greenplum и PostgreSQL, что упрощает миграцию с других систем и позволяет сохранить уже накопленные данные. Есть встроенные инструменты по управлению доступом, шифрованию, маскированию чувствительных данных и аудиту.

Важно, что данные в системе можно обрабатывать параллельно в разных кластерах — в зависимости от команд, приложений или типов запросов. Это снижает риски конфликтов и позволяет избежать повторного копирования данных. Изменение ресурсов происходит динамически, без простоев.

Управление платформой осуществляется через единый интерфейс, где можно настраивать кластеры, пользователей и масштабирование.

MWS Data Lakehouse входит в более широкий стек сервисов MWS Data, который включает решения для хранения, обработки и анализа данных, а также инструменты для автоматизации и работы с ИИ.

Нейросеть для ЖКХ научилась материться в первый месяц обучения

Разработчикам отечественного голосового помощника для сферы ЖКХ пришлось «переучивать» систему после того, как в процессе обучения бот освоил ненормативную лексику. Этот случай наглядно показал, насколько критично качество данных, на которых обучаются нейросети.

О возникшей проблеме рассказал ТАСС президент Национального объединения организаций в сфере технологий информационного моделирования (НОТИМ) Михаил Викторов на Сибирском строительном форуме, который проходит в Новосибирске.

«Приведу забавный случай: нейросеть учится, и буквально уже в первый месяц разработчики обнаружили такую коллизию — нейросеть научилась мату. Как говорится, с кем поведёшься, от того и наберёшься. Эту проблему, конечно, пришлось устранять. Но это в том числе показатель активного взаимодействия с нашими гражданами», — рассказал Михаил Викторов.

При этом, по его словам, внедрение ботов позволило сократить число операторов кол-центров в 5–6 раз без потери качества обслуживания. Нейросетевые инструменты способны обрабатывать до 90% входящих обращений.

Уровень удовлетворённости качеством обслуживания, по оценке Викторова, составляет около 80%. Передавать звонки операторам целесообразно лишь в экстренных случаях — например, при аварийных ситуациях.

Эксперты ранее отмечали, что именно данные, на которых обучается ИИ, являются ключевой причиной появления некорректных или предвзятых ответов нейросетевых инструментов.

RSS: Новости на портале Anti-Malware.ru