Компания MWS Cloud (входит в МТС Web Services) представила платформу MWS Data Lakehouse — решение для работы с данными разного типа: структурированными, неструктурированными и векторными. Платформа предназначена для задач аналитики, машинного обучения и инференса больших языковых моделей.
Среди возможностей — работа с петабайтами данных, хранение и обработка информации о продажах, логистике, заказах, платёжах и других бизнес-процессах. На базе платформы можно запускать модели для прогноза спроса, расчёта вероятности возврата кредитов, оптимизации маршрутов и других сценариев.
Одно из ключевых отличий — архитектура, которая позволяет независимо масштабировать хранение и вычисления. Это даёт гибкость в управлении ресурсами и помогает экономить: по оценкам MWS, на 40% меньше затрат по сравнению с классическими DWH-решениями. Такой эффект достигается за счёт отказа от дублирования данных, централизованного управления и автоматизации рутинных задач.
Для развёртывания можно использовать Kubernetes и совместимое с S3 объектное хранилище. Платформа поддерживает форматы Apache Parquet и Iceberg, совместима с Greenplum и PostgreSQL, что упрощает миграцию с других систем и позволяет сохранить уже накопленные данные. Есть встроенные инструменты по управлению доступом, шифрованию, маскированию чувствительных данных и аудиту.
Важно, что данные в системе можно обрабатывать параллельно в разных кластерах — в зависимости от команд, приложений или типов запросов. Это снижает риски конфликтов и позволяет избежать повторного копирования данных. Изменение ресурсов происходит динамически, без простоев.
Управление платформой осуществляется через единый интерфейс, где можно настраивать кластеры, пользователей и масштабирование.
MWS Data Lakehouse входит в более широкий стек сервисов MWS Data, который включает решения для хранения, обработки и анализа данных, а также инструменты для автоматизации и работы с ИИ.