Открытая ИИ-модель научилась читать геномы от бактерий до человека

Открытая ИИ-модель научилась читать геномы от бактерий до человека

Открытая ИИ-модель научилась читать геномы от бактерий до человека

Команда Arc Institute вместе с инженерами NVIDIA представила Evo 2 — геномную ИИ-модель, которая умеет не только предсказывать следующий символ в ДНК, но и в целом довольно неплохо понимать генетический код во всех доменах жизни — от бактерий до человека.

Самое приятное для науки: проект выложили полностью открыто — с весами модели, кодом и датасетом.

Если первая Evo отлично чувствовала себя на бактериальных геномах (там гены часто стоят кучками по смыслу), то с эукариотами всё куда хаотичнее: интроны, сплайсинг, регуляторные участки, которые могут быть далеко от гена, и море слабых статистических сигналов. Evo 2 как раз и задумали как ответ на эту сложную логику больших геномов.

Технически это модель на архитектуре StripedHyena 2, которая умеет работать с очень длинным контекстом — до 1 млн нуклеотидов за раз. Обучали её на OpenGenome2: это почти 9 трлн пар оснований/«токенов» ДНК из всех доменов жизни (включая бактериофаги).

При этом датасет, по описанию авторов, специально «подрезали» по части вирусов, заражающих эукариот, чтобы снизить риски потенциального злоупотребления.

Интереснее всего даже не масштаб, а то, что модель «нащупала» сама. В аннотациях к работе описывают, что Evo 2 выучила признаки вроде границ экзонов / интронов (сплайс-сайтов), участков связывания транскрипционных факторов, даже некоторые структурные элементы белков — то есть куски биологии, которые человеку часто приходится ловить отдельными инструментами и с погрешностями.

А в прикладной части авторы показывают, что Evo 2 может оценивать влияние вариантов в геноме без дообучения под конкретную задачу — например, для вариантов гена BRCA1 в тестах заявляется точность выше 90% в классификации «похоже на доброкачественный» против «потенциально патогенный». Это ровно тот случай, когда модель может стать полезным фильтром: подсказать, на какие мутации тратить время в лаборатории в первую очередь.

Аладдин добавила строгую аутентификацию в JaCarta Identity Provider

Компания «Аладдин» выпустила обновленную версию решения JaCarta Identity Provider (JIP), предназначенного для организации единой аутентификации пользователей в корпоративных приложениях и сервисах. Главным изменением стала поддержка механизма строгой аутентификации с использованием цифровых сертификатов, размещённых на USB-токенах и смарт-картах.

Теперь пользователи могут подтверждать свою личность при входе в корпоративные системы не только по стандартным сценариям авторизации, но и с применением аппаратных носителей ключевой информации.

Обновление связано в том числе с требованиями российского законодательства. В компании отмечают, что новый функционал позволяет организациям учитывать положения приказа ФСТЭК России №117, который предусматривает использование механизмов однократного входа (SSO) и строгой аутентификации в государственных информационных системах и на объектах критической информационной инфраструктуры.

JaCarta Identity Provider используется для организации единой точки входа в корпоративные приложения по протоколам SAML и OpenID Connect. После одной успешной аутентификации пользователь получает доступ ко всем подключённым сервисам без необходимости повторного ввода учетных данных.

Помимо поддержки сертификатов, в JIP сохранены и другие способы подтверждения личности. В частности, решение поддерживает аутентификацию по Kerberos-билетам, а также усиленную аутентификацию с использованием одноразовых паролей (OTP) и пуш-уведомлений при работе совместно с сервером JaCarta Authentication Server.

Также в новой версии доступны функции аудита и мониторинга. Система ведёт журнал аутентификаций и действий пользователей и администраторов, что может использоваться для контроля безопасности и расследования инцидентов.

По мере ужесточения требований к защите государственных и корпоративных информационных систем интерес к технологиям многофакторной и сертификатной аутентификации продолжает расти. Особенно это касается организаций, работающих с критически важной инфраструктурой и государственными данными, где компрометация учетных записей остаётся одним из наиболее распространённых сценариев атак.

RSS: Новости на портале Anti-Malware.ru