Открытая ИИ-модель научилась читать геномы от бактерий до человека

Открытая ИИ-модель научилась читать геномы от бактерий до человека

Открытая ИИ-модель научилась читать геномы от бактерий до человека

Команда Arc Institute вместе с инженерами NVIDIA представила Evo 2 — геномную ИИ-модель, которая умеет не только предсказывать следующий символ в ДНК, но и в целом довольно неплохо понимать генетический код во всех доменах жизни — от бактерий до человека.

Самое приятное для науки: проект выложили полностью открыто — с весами модели, кодом и датасетом.

Если первая Evo отлично чувствовала себя на бактериальных геномах (там гены часто стоят кучками по смыслу), то с эукариотами всё куда хаотичнее: интроны, сплайсинг, регуляторные участки, которые могут быть далеко от гена, и море слабых статистических сигналов. Evo 2 как раз и задумали как ответ на эту сложную логику больших геномов.

Технически это модель на архитектуре StripedHyena 2, которая умеет работать с очень длинным контекстом — до 1 млн нуклеотидов за раз. Обучали её на OpenGenome2: это почти 9 трлн пар оснований/«токенов» ДНК из всех доменов жизни (включая бактериофаги).

При этом датасет, по описанию авторов, специально «подрезали» по части вирусов, заражающих эукариот, чтобы снизить риски потенциального злоупотребления.

Интереснее всего даже не масштаб, а то, что модель «нащупала» сама. В аннотациях к работе описывают, что Evo 2 выучила признаки вроде границ экзонов / интронов (сплайс-сайтов), участков связывания транскрипционных факторов, даже некоторые структурные элементы белков — то есть куски биологии, которые человеку часто приходится ловить отдельными инструментами и с погрешностями.

А в прикладной части авторы показывают, что Evo 2 может оценивать влияние вариантов в геноме без дообучения под конкретную задачу — например, для вариантов гена BRCA1 в тестах заявляется точность выше 90% в классификации «похоже на доброкачественный» против «потенциально патогенный». Это ровно тот случай, когда модель может стать полезным фильтром: подсказать, на какие мутации тратить время в лаборатории в первую очередь.

Yandex B2B Tech запустила Stackland для разработки в закрытом контуре

Yandex B2B Tech вывела на рынок Yandex Cloud Stackland — платформу для развёртывания и масштабирования ИТ-приложений в закрытом контуре компании. Решение рассчитано в том числе на проекты с искусственным интеллектом. Речь идёт о готовой инфраструктурной платформе, которую можно развернуть на собственных или арендованных серверах.

Внутри уже предусмотрены базовые компоненты, которые обычно нужны командам разработки: управляемые базы данных, контейнерный оркестратор, объектное хранилище и инструменты для работы с ИИ-нагрузками, включая управление доступом к графическим ускорителям.

В компании говорят, что Stackland можно развернуть за несколько часов. Идея здесь довольно понятная: снять с команды часть инфраструктурной рутины, чтобы разработчики меньше времени тратили на поддержку среды и быстрее переходили к работе над самими продуктами.

 

Платформа ориентирована на компании, которые по разным причинам не хотят полностью переносить разработку в публичное облако. Это может быть связано и с внутренними требованиями, и с регуляторными ограничениями, и просто с привычной для бизнеса гибридной моделью, когда часть данных и сервисов остаётся внутри собственного контура.

Отдельно отмечается, что Stackland можно встроить в уже существующую инфраструктуру без полной перестройки текущего ИТ-ландшафта. То есть бизнесу не обещают революцию с заменой всего и сразу, а скорее предлагают ещё один слой, который можно встроить поверх привычной среды.

 

Через Stackland можно не только разрабатывать собственные решения, но и подключать отдельные сервисы Yandex Cloud. Уже сейчас на платформе доступны Yandex SpeechSense и Yandex DataLens, а позже должен появиться и Yandex AI Studio — продукт для создания ИИ-приложений и агентов.

По словам компании, в закрытом режиме платформу уже тестировали несколько организаций из сфер электронной коммерции, финтеха, ретейла и промышленности. Среди названных примеров — Альфа-Капитал и АО «Кириллица». Внедрением и поддержкой Stackland также занимаются партнёры, включая Hilbert Team, Neoflex, KTS, Навикон и АБ Групп.

RSS: Новости на портале Anti-Malware.ru