Открытая ИИ-модель научилась читать геномы от бактерий до человека

Открытая ИИ-модель научилась читать геномы от бактерий до человека

Открытая ИИ-модель научилась читать геномы от бактерий до человека

Команда Arc Institute вместе с инженерами NVIDIA представила Evo 2 — геномную ИИ-модель, которая умеет не только предсказывать следующий символ в ДНК, но и в целом довольно неплохо понимать генетический код во всех доменах жизни — от бактерий до человека.

Самое приятное для науки: проект выложили полностью открыто — с весами модели, кодом и датасетом.

Если первая Evo отлично чувствовала себя на бактериальных геномах (там гены часто стоят кучками по смыслу), то с эукариотами всё куда хаотичнее: интроны, сплайсинг, регуляторные участки, которые могут быть далеко от гена, и море слабых статистических сигналов. Evo 2 как раз и задумали как ответ на эту сложную логику больших геномов.

Технически это модель на архитектуре StripedHyena 2, которая умеет работать с очень длинным контекстом — до 1 млн нуклеотидов за раз. Обучали её на OpenGenome2: это почти 9 трлн пар оснований/«токенов» ДНК из всех доменов жизни (включая бактериофаги).

При этом датасет, по описанию авторов, специально «подрезали» по части вирусов, заражающих эукариот, чтобы снизить риски потенциального злоупотребления.

Интереснее всего даже не масштаб, а то, что модель «нащупала» сама. В аннотациях к работе описывают, что Evo 2 выучила признаки вроде границ экзонов / интронов (сплайс-сайтов), участков связывания транскрипционных факторов, даже некоторые структурные элементы белков — то есть куски биологии, которые человеку часто приходится ловить отдельными инструментами и с погрешностями.

А в прикладной части авторы показывают, что Evo 2 может оценивать влияние вариантов в геноме без дообучения под конкретную задачу — например, для вариантов гена BRCA1 в тестах заявляется точность выше 90% в классификации «похоже на доброкачественный» против «потенциально патогенный». Это ровно тот случай, когда модель может стать полезным фильтром: подсказать, на какие мутации тратить время в лаборатории в первую очередь.

Servicepipe выпустила антифрод-систему с цифровым отпечатком пользователя

Российская компания Servicepipe представила новый продукт Digital Fraud Protection, предназначенный для выявления мошеннических действий на сайтах и в мобильных приложениях. Решение анализирует поведение пользователей и технические параметры их устройств, помогая обнаруживать подозрительную активность даже в тех случаях, когда она выглядит как обычная работа легального клиента.

В основе продукта лежит технология формирования цифрового отпечатка браузера. Система собирает и анализирует более 100 различных параметров устройства, браузера и сетевого окружения в ключевых точках пользовательского пути — например, во время авторизации, оплаты или использования промокодов.

По словам разработчиков, такой подход позволяет выявлять злоумышленников даже тогда, когда они меняют IP-адреса, используют VPN, Tor, антидетект-браузеры или регулярно очищают файлы cookie.

Digital Fraud Protection ориентирован на поиск сложных мошеннических сценариев, которые трудно обнаружить стандартными средствами защиты. Среди них — угон учетных записей, создание множества аккаунтов одним пользователем, злоупотребление бонусными программами и мошенничество с онлайн-платежами.

Решение выросло из исследований Лаборатории кибербезопасности Servicepipe, где изучались методы идентификации устройств и выявления аномалий по совокупности технических признаков. Накопленные данные и алгоритмы анализа стали основой отдельного коммерческого продукта.

Интеграция системы выполняется через JavaScript-агент, который встраивается в веб-ресурс. При этом продукт может использоваться как самостоятельный инструмент или как источник дополнительной информации для уже существующих антифрод-систем.

В результате компания получает расширенную аналитику о том, кто именно выполняет то или иное действие на сайте: использует ли пользователь VPN, работает ли через режим инкогнито, связан ли его трафик с хостинговой инфраструктурой, которая ранее использовалась для автоматизированных атак, и другие технические признаки риска.

Наиболее востребованным такое решение может оказаться в финансовом секторе, электронной коммерции, сервисах доставки, маркетплейсах и подписочных платформах — там, где ежедневно проходят тысячи регистраций, авторизаций и платежных операций.

RSS: Новости на портале Anti-Malware.ru